学习资源 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

图像处理，扩展应用场景。  可解释性：注重模型输出的可解释性和透明性。 DeepSeek R1  高效推理：专注于低延迟和高吞吐量，适合实时应用。  轻量化设计：模型结构优化，资源占用少，适合边缘设备和移动端。  多任务支持：支持多种任务，如文本生成、分类和问答。 Kimi k1.5  垂直领域优化：针对特定领域（如医疗、法律）进行优化，提供高精度结果。长文本处理：擅长处理长文本和复杂文档，适合专业场景。  定制化能力：支持用户自定义训练和微调，适应特定需求。 Open AI o3 mini  小型化设计：轻量级模型，适合资源有限的环境。  快速响应：优化推理速度，适合实时交互场景。  通用性强：适用于多种自然语言处理任务，如对话生成和文本理解。爬虫数据采集 1、阅读网页源代码，提取特定网页内容；中小企业AI定制化服务：为中小企业提供定制化的AI解决方案，如智能客服、营销和办公工具，提升企业竞争力。 • 开源AI教育平台：借助DeepSeek R1 的低成本特性，创建开源AI教育平台，提供免费课程和实验资源，促进AI教育普及。 • 智能编程教育助手：为编程学生提供实时编程指导，自动生成代码示例，帮助解决编程难题。 • 自动化代码审查工具：自动审查代码，发现潜在问题并提供优化建议，提升开发效

0 码力 | 85 页 | 8.31 MB | 8 月前
3
开源中国 2023 大模型(LLM)技术报告

LLM 技术报告大语言模型（LLM）技术作为人工智能领域的一项重要创新在今年引起了广泛的关注。 LLM 是利用深度学习和大数据训练的人工智能系统，专门设计来理解、生成和回应自然语言。这些模型通过分析大量的文本数据来学习语言的结构和用法，从而能够执行各种语言相关任务。以 GPT 系列为代表，LLM 以其在自然语言处理领域的卓越表现，成为推动语言理解、生成和应用的引擎。 LLM / 32 LLM 基础设施：大模型框架及微调 (Fine Tuning) 大模型框架指专门设计用于构建、训练和部署大型机器学习模型和深度学习模型的软件框架。这些框架提供了必要的工具和库，使开发者能够更容易地处理大量的数据、管理巨大的网络参数量，并有效地利用硬件资源。微调（Fine Tuning）是在大模型框架基础上进行的一个关键步骤。在模型经过初步的大规模预训练后，微调是用较小、特定领域的数据集对模型进行后续训练，以使：为了处理大型数据集和大规模参数网络，这些框架通常设计得易于水平扩展，支持在多个处理器或多个服务器上并行处理。：它们提供工具来有效地加载、处理和迭代大型数据集，这对于训练大型模型尤为重要。国产深度学习框架 OneFlow 架构（图源：https://www.oneflow.org/a/chanpin/oneflow/） 9 / 32 LLM 基础设施：大模型框架及微调 (Fine Tuning)

0 码力 | 32 页 | 13.09 MB | 1 年前
3
DeepSeek从入门到精通(20250204)

例如：DeepSeek-R1，GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。推理大模型：推理大模型是指能够在传统的大语言模型基础上，强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术，比如强化学习、神经符号推理、元学习等，来增强其推理和问题解决能力。非推理大模型：适用于大多数任务，非推理大模型一般侧重于语言生成、上下文理解和自然语言处理，而不强调深度推理能力。此类模型通常通过对大量文本数据的训通过多步引导，实现更深入的内容探讨控制每个步骤的输出深度，避免冗余创意激发多角度提示激发AI的创造性思维在创意和连贯之间找到平衡质量控制多次迭代提高内容质量需要更多的实践和计算资源灵活调整可根据中奖结果随时调整后续提示实时调整需要较高的判断和决策能力提示语链的优势与挑战提示语链的设计原则 01 目标明确性 02 逻辑连贯性 03 渐进复杂性 04 灵活适应性 Connection（连接）：建立子任务之间的逻辑关联 • Temporal Arrangement（时序安排）：考虑任务的时间维度 • Resource Allocation（资源分配）：为每个子任务分配适当的注意力资源 • Adaptation（适应）：根据AI反馈动态调整任务结构为了更有效地进行任务分解，可以采用SPECTRA模型（Systematic Partitioning for

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

例如：DeepSeek-R1，GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。推理大模型：推理大模型是指能够在传统的大语言模型基础上，强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术，比如强化学习、神经符号推理、元学习等，来增强其推理和问题解决能力。非推理大模型：适用于大多数任务，非推理大模型一般侧重于语言生成、上下文理解和自然语言处理，而不强调深度推理能力。此类模型通常通过对大量文本数据的训通过多步引导，实现更深入的内容探讨控制每个步骤的输出深度，避免冗余创意激发多角度提示激发AI的创造性思维在创意和连贯之间找到平衡质量控制多次迭代提高内容质量需要更多的实践和计算资源灵活调整可根据中奖结果随时调整后续提示实时调整需要较高的判断和决策能力提示语链的优势与挑战提示语链的设计原则 01 目标明确性 02 逻辑连贯性 03 渐进复杂性 04 灵活适应性 Connection（连接）：建立子任务之间的逻辑关联 • Temporal Arrangement（时序安排）：考虑任务的时间维度 • Resource Allocation（资源分配）：为每个子任务分配适当的注意力资源 • Adaptation（适应）：根据AI反馈动态调整任务结构为了更有效地进行任务分解，可以采用SPECTRA模型（Systematic Partitioning for

0 码力 | 103 页 | 5.40 MB | 9 月前
3
清华大学普通人如何抓住DeepSeek红利

普通人如何抓住DeepSeek红利 p Deepseek是什么？ p Deepseek能够做什么？ ——在工作、学习、生活和社会关系中解决问题 p 如何提问？让AI一次性生成你想要的东西卷不动了？DeepSeek帮你一键“躺赢”！学习太难？DeepSeek带你“开挂”逆袭！生活太累？DeepSeek帮你“减负”到家！社交障碍？DeepSeek教你“高情商”破局！，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正式版。 • DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAl-o1正式版。 (Pass@1) 致的误解和错误。通过DeepSeek的数据分析功能，新员工可以更深入地理解行业动态和公司运营，做出更明智的决策。成本更低：减少了对培训资源的依赖，新员工可以通过DeepSeek 自主学习，降低培训成本。通过提高工作效率，减少了人力资源的浪费，降低了整体运营成本。场景3：日常客户沟通与问题反馈处理常见问题：与甲方客户的沟通效率低，信息不对称，导致响应不及时或错误场景：在

0 码力 | 65 页 | 4.47 MB | 8 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

解决复杂问题 7政企、创业者必读 8 AI不仅是技术革新，更是思维方式和社会结构的变革国家产业个人企业政企、创业者必读人工智能发展历程（一）  从早期基于规则的专家系统，走向基于学习训练的感知型AI  从基于小参数模型的感知型AI，走向基于大参数模型的认知型AI  从擅长理解的认知型AI，发展到擅长文字生成的生成式AI  从语言生成式AI，发展到可理解和生成声音、图片、视频的多模态AI 认为大模型的能力无法进一步得到质的提升开辟强化学习新范式从预训练Scaling Law转变为强化学习Scaling Law 大数据+大参数+大算力的预训练Scaling Law的边际效应递减 • 人类构造的训练数据已达上限 • 万亿参数规模之后，继续增大参数规模难以带来质的提升 • 训练算力成本和工程化难度大幅上升强化学习Scaling Law • 利用合成数据解决数据用尽问题利用合成数据解决数据用尽问题 • 利用self-play强化学习，在不增大参数规模前提下，大幅提升复杂推理能力 • 通过后训练算力和推理算力，在不增加预训练算力前提下，大幅提升模型性能 DeepSeek颠覆式创新——技术创新 26政企、创业者必读  预训练模型如GPT——疯狂读书，积累知识，Scaling law撞墙  预训练模型思考深度不够  算力见顶，变成少数巨头游戏预训练大模型推理大模型

0 码力 | 76 页 | 5.02 MB | 6 月前
3
人工智能安全治理框架 1.0

各环节都面临安全风险，既面临自身技术缺陷、不足带来的风险，也面临不当使用、滥用甚至恶意利用带来的安全风险。 3.1 人工智能内生安全风险 3.1.1 模型算法安全风险（a）可解释性差的风险。以深度学习为代表的人工智能算法内部运行逻辑复杂，推理过程属黑灰盒模式，可能导致输出结果难以预测和确切归因，如有异常难以快速修正和溯源追责。（b）偏见、歧视风险。算法设计及训练过程中，个人偏见被有意、无意引入，人工智能安全治理框架漏洞等脆弱点，还可能被恶意植入后门，存在被触发和攻击利用的风险。（b）算力安全风险。人工智能训练运行所依赖的算力基础设施，涉及多源、泛在算力节点，不同类型计算资源，面临算力资源恶意消耗、算力层面风险跨边界传递等风险。（c）供应链安全风险。人工智能产业链呈现高度全球化分工协作格局。但个别国家利用技术垄断和出口管制等单边强制措施制造发展壁垒，恶意阻断全球生产关系的大幅改变，加速重构传统行业模式，颠覆传统的就业观、生育观、教育观，对传统社会秩序的稳定运行带来挑战。（c）未来脱离控制的风险。随着人工智能技术的快速发展，不排除人工智能自主获取外部资源、自我复制，产生自我意识，寻求外部权力，带来谋求与人类争夺控制权的风险。 4. 技术应对措施针对上述安全风险，模型算法研发者、服务提供者、系统使用者等需从训练数据、算力设施、模型算法、产品服务、应用场景各方面采取技术措施予

0 码力 | 20 页 | 3.79 MB | 1 月前
3
国家人工智能产业综合标准化体系建设指南（2024版）

产模式和经济发展形态，将对加快建设制造强国、网络强国和数字中国发挥重要的支撑作用。人工智能产业链包括基础层、框架层、模型层、应用层等 4 个部分。其中，基础层主要包括算力、算法和数据，框架层主要是指用于模型开发的深度学习框架和工具，模型层主要是指大模型等技术和产品，应用层主要是指人工智能技术在行业场景的应用。近年来，我国人工智能产业在技术创新、产品创造和行业应用等方面实现快速发展，形成庞大市场规模。伴随以大模型为代（三）关键技术标准关键技术标准主要包括机器学习、知识图谱、大模型、自然语言处理、智能语音、计算机视觉、生物特征识别、人机混合增强智能、智能体、群体智能、跨媒体智能、具身智能等标准。 1. 机器学习标准。规范机器学习的训练数据、数据预处理、模型表达和格式、模型效果评价等，包括自监督学习、无监督学习、半监督学习、深度学习、强化学习等标准。 2. 知识图谱标准。规范知识图谱的描述、构建、运维、共文本处理、语义处理等方面的技术要求和评测方法，包括语法分析、语义理解、语义表达、机器翻译、自动摘要、自动问答、语言大模型等标准。 5. 智能语音标准。规范前端处理、语音处理、语音接口、数据资源等技术要求和评测方法，包括深度合成的鉴伪方法、全双工交互、语音大模型等标准。 6. 计算机视觉标准。规范图像获取、图像/视频处理、图像内容分析、三维计算机视觉、计算摄影学、跨媒体融合等技术要

0 码力 | 13 页 | 701.84 KB | 1 年前
3
清华大学第二弹：DeepSeek赋能职场

Lab - PII Data Detecti on 金牌金山办公2024中文文本智能校对大赛第二名 2024 法研杯法律要素争议焦点识别第二名 AFAC2024金融智能创新大赛金融工具学习三等奖 Googl e kaggl e全球专利文件短语相似性匹配金牌 Googl e kaggl e全球自动问答比赛金牌 Googl e kaggl e全球医疗对话理解金牌 2021 2. 能力矩阵 (Capability Matrix) •功能范围 •专业技能 •决策权限约束层: 3. 边界系统 (Boundary System) •伦理规范 •安全限制 •资源约束操作层: 4. 工作引擎 (Operation Engine) •输入处理 •执行流程 •输出规范如何使用DeepSeek制作可视化图表？如何使用DeepSeek制作可视化图表？

0 码力 | 35 页 | 9.78 MB | 8 月前
3
DeepSeek图解10页PDF

. . . . . . . . . . . . . . . . 7 2.3.2 监督微调（Supervised Fine-Tuning, SFT） . . . . . . 7 2.3.3 强化学习（Reinforcement Learning, RL） . . . . . . . 7 3 DeepSeek-R1 精华图解 . . . . . . . . . . . . . . . . . R1-Zero 的中间推理模型 . . . . . . . 8 3.1.2 核心创新 2：通用强化学习 . . . . . . . . . . . . . . . 8 3.2 含 R1-Zero 的中间推理模型训练过程 . . . . . . . . . . . . . . 9 3.3 通用强化学习训练过程 . . . . . . . . . . . . . . . . . . . . . . 10 Ollama 软件启动 deepseek-r1 界面 1.3 DeepSeek 本地运行使用演示基于上面步骤搭建完成后，接下来提问 DeepSeek 一个问题：请帮我分析 Python 编程如何从零开始学习?，下面是它的回答，首先会有一个 think 标签，这里面嵌入的是它的思考过程，不是正式的回复：图 5: deepseek-r1 回复之思考部分等我们看到另一个结束标签 think 后，表明它的思考已经结束，下面一行

0 码力 | 11 页 | 2.64 MB | 8 月前
3

共 14 条前往

页

分类

语言

格式