开发阶段 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

析法律文本，提取关键信息，自动生成合同草案、法律意见书等，提高律师工作效率。 • 智能医疗数据分析与诊断：构建智能医疗平台，分析病历、检查报告和基因数据，帮助医生提供更准确的诊断与治疗方案。 • 金融风险预测与管理：开发金融风险分析工具，收集并分析市场数据，预测风险并为金融机构提供管理建议。 • 智能文学创作辅助：为作家提供创作灵感和文本构思，生成符合中文文学传统的故事情节和诗句，助力突破创作瓶颈。 • 免费课程和实验资源，促进AI教育普及。 • 智能编程教育助手：为编程学生提供实时编程指导，自动生成代码示例，帮助解决编程难题。 • 自动化代码审查工具：自动审查代码，发现潜在问题并提供优化建议，提升开发效率与代码质量。新思路：Open AI o3mini的数据应用推理响应速度快写作情感表达能力格式化输出能力数据分析效率高计撰写的提示词，精准规避AI生成中的幻觉问题。  高规范格式输出：所生成的综述文档格式规范、结构清晰，符合学术论文标准，用户几乎无需进行二次整理。中科院PubScholar平台 “PubScholar”平台是由中国科学院开发的公益学术平台，整合了国内外多种学术资源。该平台提供文献检索、引用分析、文献推荐等功能，用户可通过平台高效获取科研资源，并生成相关的综述报告。平台的优势在于其广泛的数据源和智能化的

0 码力 | 85 页 | 8.31 MB | 8 月前
3
DeepSeek从入门到精通(20250204)

DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。文本生成表格、列表生成（如日程安排、菜谱）跨域整合能力将专业领域知识转化为有效的提示语利用提示语桥接不同学科和AI能力创造跨领域的创新解决方案系统思维设计多步骤、多维度的提示语体系构建提示语模板库，提高效率和一致性开发提示语策略，应对复杂场景表1-3-2提示语设计进阶技能子项核心技能子项语境理解深入分析任务背景和隐含需求考虑文化、伦理和法律因素预测可能的误解和边界情况抽象化能力识别通用模式，提高提示语可复用性整。 4. 请求同行或专家对内容进行审阅并提供反馈。 5. 根据反馈意见，逐步优化和完善文章的各个部分。 1. 请对当前内容进行评估，列出主要优缺点，并提出具体的改进建议。 2. 请根据前一阶段的反馈，逐步修改和完善内容，列出修改的具体步骤。 3. 请根据内容生成过程中出现的新问题，动态调整后续提示语，并解释调整原因。 4. 请收集多方反馈，综合考虑并调整内容生成方向，列出不同来源的反馈及其

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。文本生成表格、列表生成（如日程安排、菜谱）跨域整合能力将专业领域知识转化为有效的提示语利用提示语桥接不同学科和AI能力创造跨领域的创新解决方案系统思维设计多步骤、多维度的提示语体系构建提示语模板库，提高效率和一致性开发提示语策略，应对复杂场景表1-3-2提示语设计进阶技能子项核心技能子项语境理解深入分析任务背景和隐含需求考虑文化、伦理和法律因素预测可能的误解和边界情况抽象化能力识别通用模式，提高提示语可复用性整。 4. 请求同行或专家对内容进行审阅并提供反馈。 5. 根据反馈意见，逐步优化和完善文章的各个部分。 1. 请对当前内容进行评估，列出主要优缺点，并提出具体的改进建议。 2. 请根据前一阶段的反馈，逐步修改和完善内容，列出修改的具体步骤。 3. 请根据内容生成过程中出现的新问题，动态调整后续提示语，并解释调整原因。 4. 请收集多方反馈，综合考虑并调整内容生成方向，列出不同来源的反馈及其

0 码力 | 103 页 | 5.40 MB | 9 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

慢思考能力传统软件是辅助人的工具，Agent是能够自主工作的数字员工，是新的生产力政企、创业者必读 22 DeepSeek出现之前的十大预判之九开源效果追赶上闭源  技术开放，吸引广大开发人员和用户使用  很多公司参与开源，帮助改进产品，众人拾柴火焰高，反哺开源产品，形成正循环政企、创业者必读 DeepSeek出现之前的十大预判之十中美差距快速缩小  美国预训练堆算 DeepSeek-R1 探索出RL方法，且公开技术 • 诞生推理型Scaling Law DeepSeek颠覆式创新——技术创新 29政企、创业者必读技术上实现对美国的赶超掌握通向AI下一阶段的方法论 DeepSeek颠覆式创新——技术创新  美国人仍在遵循预训练Scaling law范式，走堆显卡路线，如 “星际之门”计划  中国DeepSeek-R1的创新突破，诞生推理型Scaling DeepSeek颠覆式创新——用户体验 32 ——掀起新一轮AI科普教育认知决定行动，这场全民AI科普对推动中国AI发展功不可没政企、创业者必读开源改变行业格局，建立强大生态  开源战胜闭源，促使全球公司、开发者等转到开源  建立强大生态，成为全球人工智能根技术，无推广情况下各国政府、企业、云厂商纷纷接入，获得全球最大影响力  改变中美竞争格局：美国是闭源封闭垄断思路，中国领导开源文化，加速中国领先地位

0 码力 | 76 页 | 5.02 MB | 6 月前
3
普通人学AI指南

技术可以生成如下类型的内容： • 图像：如照片、原创艺术作品 • 音频：如视频游戏中的配音、音乐 • 文本：如代码、广告文案、小说 • 3D 模型：如角色、场景目前，AIGC 技术处于早期阶段，最常见的产品形态是基于文本的，通过用户输入来控制内容的生成。用户输入文本描述所需的内容，然后模型输出与描述相符的内容。下图 1描述了 AI 大模型，AIGC 和 AGI 关系。 Figure 8B 和 70B 模型。图 2，时间线主要根据技术论文的发布日期（例如提交至 arXiv 的日期）来确定大型语言模型（大小超过 10B）的发展历程。如果没有相应的论文，我们将模型的日期设定为其公开发布或宣布的最早时间。我们用黄色标记那些公开可用的模型检查点。由于空间限制，我们只包括那些公开报道评估结果的大型语言模型。 Figure 2: 各个大型语言模型发布时间线 5 1.4 基础概念工具，分别包括：问答，图像，视频，AI 编程，AI 提示词和 AI 大模型，一共梳理挑选共计 38 个 AI 工具，其中很多都是开源！ 2.1 问答 2.1.1 ChatGPT ChatGPT 是一个由 OpenAI 开发的大型语言模型，它基于 GPT（Generative Pre-trained Transformer）架构。这种模型通过分析大量的文本数据来学习语言结构和信息，使其能够生成连贯的文本、回答问题、撰写文章、进行对话等。

0 码力 | 42 页 | 8.39 MB | 8 月前
3
清华大学普通人如何抓住DeepSeek红利

GI)的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正式版。 • DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAl-o1正式版。 (Pass@1) 6 n p Y d O w t v B 4 G 0 G p y 8 U I q e T 9 M 6 Deepseek的能力图谱直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。决策支持文体转换个性化推荐场景1：1小时内写完一个1万字的项目书是否可用DeepSeek（深度求索）辅助处理？可以，但需分阶段“榨干AI效率”，核心策略：框架复制+模块填充+数据嫁接。分步解决方案：第一阶段：5分钟——用AI暴力生成框架（目标：3000字）场景1：1小时内写完一个1万字的项目书第二阶段：20分钟——用AI批量填充模块（目标：6000字）针对每个小节单独提问，例如： “写一段‘2.1

0 码力 | 65 页 | 4.47 MB | 8 月前
3
开源中国 2023 大模型(LLM)技术报告

处理领域的卓越表现，成为推动语言理解、生成和应用的引擎。 LLM 在多个领域都取得了令人瞩目的成就。在自然语言处理领域，GPT 系列模型在文本生成、问答系统和对话生成等任务中展现出色的性能。在知识图谱构建、智能助手开发等方面，LLM 技术也发挥了关键作用。此外，它还在代码生成、文本摘要、翻译等任务中展现了强大的通用性。本报告从技术人视角出发，将深入探讨 LLM 技术的背景、基础设施、应用现状，以及相关的工具和平台。大模型训练平台与工具基础设施 LLM Agent  备案上线的中国大模型  知名大模型  知名大模型应用大模型算力工具和平台  LLMOps  大模型聚合平台  开发工具 AI 编程  插件、IDE、终端  代码生成工具编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心，随着大规模语言数据集的可用性和计算能 7 / 32 LLM 基础设施：大模型框架及微调 (Fine Tuning) 大模型框架指专门设计用于构建、训练和部署大型机器学习模型和深度学习模型的软件框架。这些框架提供了必要的工具和库，使开发者能够更容易地处理大量的数据、管理巨大的网络参数量，并有效地利用硬件资源。微调（Fine Tuning）是在大模型框架基础上进行的一个关键步骤。在模型经过初步的大规模预训练后，微调是用较小

0 码力 | 32 页 | 13.09 MB | 1 年前
3
DeepSeek图解10页PDF

主要亮点在于出色的数学和逻辑推理能力，区别于一般的通用 AI 模型。其训练方式结合了强化学习（RL）与监督微调（SFT），创造了一种高效训练，高推理能力 AI 模型的方法。整个训练过程分为核心两阶段，第一步训练基于 DeepSeek-V3 论文中的基础模型（而非最终版本），并经历了 SFT 和基于纯强化学习调优 + 通用性教程作者：郭震，工作 8 年目前美国 AI 博士在读，公众号：郭震 DeepSeek-R1-Zero R1-Zero 能生成高质量的推理数据，包括大量长链式思维（Chain-of-Thought, CoT）示例，用于支持后续的 SFT 阶段，如图7所示。更加详细介绍参考3.2节。 3.1.2 核心创新 2：通用强化学习第一阶段 R1-Zero 虽然展现出惊人的推理能力提升，但是也出现了回复时语言混合，非推理任务回复效果差的问题，为了解决这些问题，DeepSeek 提出通用强化学习训练框架。活动通用任务上的表现。更加详细介绍参考3.3节。 3.2 含 R1-Zero 的中间推理模型训练过程中间模型占据主要训练精力的阶段，实际上完全通过推理导向的强化学习直接训练而成，完全跳过了监督微调（SFT），如下图8所示，只在强化学习的冷启动阶段使用了 SFT。图 8: Interim reasoning model 训练方法大规模推理导向的强化学习训练，必不可少的就是推理数据，手动标注就

0 码力 | 11 页 | 2.64 MB | 8 月前
3
TVM工具组

负责将预训练好的 caffe 或者 tensorflow 的模型，转换到 LLVM IR，最后生成可以在无剑 SoC 平台上执行的二进制。绝赞招聘中为何添加 caffe 前端？客户需求评估阶段：客户用于评估芯片的网络，caffe 模型占很大比重。竞品已支持 caffe 前端当前各大芯片厂商的部署工具大多数都支持，支持 caffe 前端有利于提高竞争力。开源社区存量的开源 caffe

0 码力 | 6 页 | 326.80 KB | 6 月前
3
人工智能安全治理框架 1.0

………………………… 7 4.2 针对人工智能应用安全风险 ………………………… 9 5. 综合治理措施 ……………………………………………… 10 6. 人工智能安全开发应用指引 ……………………………… 12 6.1 模型算法研发者安全开发指引 ……………………… 12 6.2 人工智能服务提供者安全指引 ……………………… 13 6.3 重点领域使用者安全应用指引 ……………………… 14 6 应用场景，提出通过安全软件开发、数据质量提升、安全建设运维、测评监测加固等技术手段提升人工智能产品及应用的安全性、公平性、可靠性、鲁棒性- 3 - 人工智能安全治理框架的措施。 2.3 综合治理措施方面。明确技术研发机构、服务提供者、用户、政府部门、行业协会、社会组织等各方发现、防范、应对人工智能安全风险的措施手段，推动各方协同共治。 2.4 安全开发应用指引方面。明确模型算法研发者、服务提供者、重点安全开发应用指引方面。明确模型算法研发者、服务提供者、重点领域用户和社会公众用户，开发应用人工智能技术的若干安全指导规范。 3. 人工智能安全风险分类人工智能系统设计、研发、训练、测试、部署、使用、维护等生命周期各环节都面临安全风险，既面临自身技术缺陷、不足带来的风险，也面临不当使用、滥用甚至恶意利用带来的安全风险。 3.1 人工智能内生安全风险 3.1.1 模型算法安全风险（a）可解释性差的风险。以深度学习为代表的人工智能算法内部运行逻

0 码力 | 20 页 | 3.79 MB | 1 月前
3

共 13 条前往

页

分类

语言

格式