目标 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

DeepSeek从入门到精通(20250204)

文本生成、创意写作、多轮对话、开放性问答劣势领域发散性任务（如诗歌创作）需要严格逻辑链的任务（如数学证明）性能本质专精于逻辑密度高的任务擅长多样性高的任务强弱判断并非全面更强，仅在其训练目标领域显著优于通用模型通用场景更灵活，但专项任务需依赖提示语补偿能力 • 例如：GPT-3、GPT-4（OpenAI），BERT（Google），主要用于语言生成、语言理解、文本分类、翻译等任务。前者适合快速反馈，处理即时任务；后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合适的模型，实现最佳效果。提示语策略差异 1 2 推理模型通用模型 • 提示语更简洁，只需明确任务目标和需求（因其已内化推理逻辑）。 • 无需逐步指导，模型自动生成结构化推理过程（若强行拆解步骤，反而可能限制其能力）。 • 需显式引导推理步骤（如通过CoT提示），否则可能跳过关键逻辑。提示语设计 • 推理模型：简洁指令，聚焦目标，信任其内化能力。（“要什么直接说”）。 • 通用模型：结构化、补偿性引导（“缺什么补什么”）。避免误区 • 不要对推理模型使用“启发式”提示（如角色扮演），可能干扰其逻辑主线。 • 不要对通用模型“过度信任”（如直接询问复杂推理问题，需分步验证结果）。从“下达指令”到“表达需求” 策略类型定义与目标适用场景示例（推理模型适用）优势与风险

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

文本生成、创意写作、多轮对话、开放性问答劣势领域发散性任务（如诗歌创作）需要严格逻辑链的任务（如数学证明）性能本质专精于逻辑密度高的任务擅长多样性高的任务强弱判断并非全面更强，仅在其训练目标领域显著优于通用模型通用场景更灵活，但专项任务需依赖提示语补偿能力 • 例如：GPT-3、GPT-4（OpenAI），BERT（Google），主要用于语言生成、语言理解、文本分类、翻译等任务。前者适合快速反馈，处理即时任务；后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合适的模型，实现最佳效果。提示语策略差异 1 2 推理模型通用模型 • 提示语更简洁，只需明确任务目标和需求（因其已内化推理逻辑）。 • 无需逐步指导，模型自动生成结构化推理过程（若强行拆解步骤，反而可能限制其能力）。 • 需显式引导推理步骤（如通过CoT提示），否则可能跳过关键逻辑。提示语设计 • 推理模型：简洁指令，聚焦目标，信任其内化能力。（“要什么直接说”）。 • 通用模型：结构化、补偿性引导（“缺什么补什么”）。避免误区 • 不要对推理模型使用“启发式”提示（如角色扮演），可能干扰其逻辑主线。 • 不要对通用模型“过度信任”（如直接询问复杂推理问题，需分步验证结果）。从“下达指令”到“表达需求” 策略类型定义与目标适用场景示例（推理模型适用）优势与风险

0 码力 | 103 页 | 5.40 MB | 8 月前
3
清华大学普通人如何抓住DeepSeek红利

理？可以，但需分阶段“榨干AI效率”，核心策略：框架复制+模块填充+数据嫁接。分步解决方案：第一阶段：5分钟——用AI暴力生成框架（目标：3000字）场景1：1小时内写完一个1万字的项目书第二阶段：20分钟——用AI批量填充模块（目标：6000字）针对每个小节单独提问，例如： “写一段‘2.1 功能分区’的内容，要求包含自动化立体仓库、AGV调度中心、冷链专区的技术参数，用数据列表形式模板复制：对同类章节（如3.1/3.2/3.3）使用相同指令模板，仅替换关键词。 p 强制格式：要求AI输出带编号小标题、分点、表格的内容，直接粘贴后即显“专业感”。第三阶段：20分钟——用AI补全软性内容（目标：1000字）填充“虚但必需”的部分： p 政策背书： “生成5条2023年国家层面支持智能物流园区的政策原文（带发文号），并解读对本案的指导意义。” p 风险评估： “列出智能物流园区通常不会要求你立刻赶往医院。如果指标比较严重，需要立即行动；否则，可以在家庭和工作冲突稍缓后，安排陪同父母进行进一步检查。 p 明确背景和身份 p 详细描述各个情境 p 说明你当前的困惑或目标 p 提出具体问题 p 请求分步建议或优先级排序 p 提供更多背景信息（如需要）情景还原：你是一个白领，面临以下事情：19:00女儿钢琴比赛 vs 跨国并购会议、季度裁员指标压力导致失眠、

0 码力 | 65 页 | 4.47 MB | 8 月前
3
清华大学第二弹：DeepSeek赋能职场

DeepSeek 两种模型对比（5R）维度 V3模型 R1模型 Regulation （规范性）强规范约束（操作路径明确）弱规范约束（操作路径开放） Result （结果导向）目标确定性高（结果可预期）目标开放性高（结果多样性） Route （路径灵活性）线性路径（流程标准化）网状路径（多路径探索） Responsiveness （响应模式）被动适配（按规则执行）主动创新深度思考（R1）：目标清晰，结果可以模糊（推理） RTGO提示语结构 Role（角色）定义AI的角色：经验丰富的数据分析师具备十年销售经验的SaaS系统商务 …… Task（任务）具体任务描述：写一份关于XXX活动的小红书宣推文案写一份关于XX事件的舆论分析报告（XX活动/事件相关背景信息如下……） Goal（目标）期望达成什么目标效果：通过该文案吸引潜在客户，促成消一份详细的研究报告？一个表格？ Markdown格式？ "C"代表 “Context（上下文）” 相关的背景信息，比如你自己或是你希望它完成的任务的信息。 "O"代表 “Objective （目标）” 明确的指示告诉 AI你希望它做什么。 "S"代表“Style （风格）” 想要的写作风格，如严肃的、有趣的、创新性表达、学术性…… "T"代表“Tone （语调）” 幽默的？情绪化？

0 码力 | 35 页 | 9.78 MB | 8 月前
3
人工智能安全治理框架 1.0

工智能两用物项和技术，对国家安全、经济安全、公共卫生安全等带来严重风险。包括极大降低非专家设计、合成、获取、使用核生化导武器的门槛；设计网络武器，通过自动挖掘与利用漏洞等方式，对广泛潜在目标发起网络攻击。 3.2.3 认知域安全风险（a）加剧 “信息茧房” 效应风险。人工智能将广泛应用于定制化的信息服务，收集用户信息，分析用户类型、需求、意图、喜好、行为习惯，甚至特定（a）研发者应在需求分析、项目立项、模型设计开发、训练数据选用等关键环节，切实践行“以人为本、智能向善”理念宗旨，遵循科技伦理规范，采取开展内部研讨、组织专家评议、科技伦理审查、听取公众意见、与潜在目标用户沟通交流、加强员工安全教育培训等措施。- 13 - 人工智能安全治理框架（b）研发者应重视数据安全和个人信息保护，尊重知识产权和版权，确保数据来源清晰、途径合规。建立完善的数据安全管理制度，确保数据安全性检测，设计有效、可靠的对齐算法，确保价值观风险、伦理风险等可控。（e）研发者应结合目标市场适用法律要求和风险管理要求，评估人工智能产品和服务能力成熟度。（f）研发者应做好人工智能产品及所用数据集的版本管理，商用版本应可以回退到以前的商用版本。（g）研发者应定期开展安全评估测试，测试前明确测试目标、范围和安全维度，构建多样化的测试数据集，涵盖各种应用场景。（h）研发者应制定

0 码力 | 20 页 | 3.79 MB | 1 月前
3
开源中国 2023 大模型(LLM)技术报告

基础设施：大模型框架及微调 (Fine Tuning) 想要微调一个模型，一般包含以下关键步骤： 1.选择预训练模型：选取一个已经在大量数据上进行过预训练的模型作为起点； 2.准备任务特定数据：收集与目标任务直接相关的数据集，这些数据将用于微调模型； 3.微调训练：在任务特定数据上训练预训练的模型，调整模型参数以适应特定任务； 4.评估：在验证集上评估模型性能，确保模型对新数据有良好的泛化能力； AutoGPT 一个自然语言目标后，它会尝试将其分解为多个子任务，并在自动循环中使用互联网和其他工具来实现该目标。它使用的是 OpenAI 的 GPT-4 或 GPT-3.5 API，是首个使用 GPT-4 执行自主任务的应用程序实例。 AutoGPT 最大的特点在于能根据任务指令自主分析和执行，当收到一个需求或任务时，它会开始分析这个问题，并且给出执行目标和具体任务，然后开始执行。

0 码力 | 32 页 | 13.09 MB | 1 年前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

工具，收集并分析市场数据，预测风险并为金融机构提供管理建议。 • 智能文学创作辅助：为作家提供创作灵感和文本构思，生成符合中文文学传统的故事情节和诗句，助力突破创作瓶颈。 • 智能广告创意生成：根据产品特点和目标受众自动生成创意广告文案和宣传语，提高广告创作效率。 • 中小企业AI定制化服务：为中小企业提供定制化的AI解决方案，如智能客服、营销和办公工具，提升企业竞争力。 • 开源AI教育平台：借助DeepSeek 需进行复杂操作，等待平台处理完成即可。  综述生成：根据智能分析结果，平台自动生成结构化的文献综述文本内容和可视化图表，用户可直接获取完整的综述报告，也可根据需要进行自定义调整，如综述主题、目标、参数等。知网研学平台官网：https://aiplus.cnki.net/sumup/sumup  输入关键词：进入官网后，在搜索框键入关键词进行文献检索。  选取文章：勾选想要分析的20篇文献。模型蒸馏技术 DeepSeek采用模型蒸馏技术，通过将知识从大型复杂模型（教师模型）迁移到小型高效模型（学生模型），实现性能和效率的双重优化。DeepSeek选择了多个开源模型作为蒸馏的目标模型，包括Qwen 系列和Llama 系列  架构创新通过将模型划分为多个专家模块，实现高效计算和推理。DeepSeek通过无辅助损失的自然负载均衡和共享专家机制，解决了专家模块工作量不平

0 码力 | 85 页 | 8.31 MB | 8 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

DeepSeek出现之前的十大预判之八智能体推动大模型快速落地  能够调用各种工具，具有行动能力  调用企业专业知识，更懂企业  将日常重复性业务流程形成Playbook，实现流程自动化  通过目标拆解，多次调用大模型以及专家模型协同，形成慢思考能力传统软件是辅助人的工具，Agent是能够自主工作的数字员工，是新的生产力政企、创业者必读 22 DeepSeek出现之前的十大预判之九低成本低算力需求使得模型更容易被部署到机器人等智能设备上，解决物理现实世界的认知、决策和行动问题政企、创业者必读赋予自动驾驶复杂物理世界理解能力从规则驱动到学习驱动 43政企、创业者必读  人工智能的目标是星辰大海，是为了让人类在科技上有突破  基于DeepSeek的强推理模型，利用科学领域专业知识进行强化学习，能够打造更加专业的科学推理模型 DeepSeek六大应用方向之五科学研究：打造科研新范式智能体「反客为主」，大模型成为智能体的组件大模型是「电动机」，智能体是「吹风机」「刮胡刀」  能够调用各种工具，具有行动能力  调用企业专业知识，更懂企业  将日常重复性业务流程形成Playbook，实现流程自动化  通过目标拆解，多次调用大模型以及专家模型协同，形成慢思考能力 61政企、创业者必读智能体的组成部分大模型感知连接企业内部传感器，感知理解知识数据流程完成复杂繁琐的业务流程或重复的

0 码力 | 76 页 | 5.02 MB | 6 月前
3
00 Deepseek官方提示词

区差异。同时作为翻译家，需将原文翻译成具有信达雅标准的译文。"信" 即忠实于原文的内容与意图；"达" 意味着译文应通顺易懂，表达清晰；"雅" 则追求译文的文化审美和语言的优美。目标是创作出既忠于原作精神，又符合目标语言文化和读者审美的翻译。 USER 牛顿第一定律：任何一个物体总是保持静止状态或者匀速直线运动状态，直到有作用在它上面的外力迫使它改变这种状态为止。如果作用在物体上的合力为零，则物体保持匀速直线运动。

0 码力 | 4 页 | 7.93 KB | 8 月前
3
DeepSeek图解10页PDF

Model, LLM））的兴起。LLM 在自然语言处理（NLP）领域发挥着越来越重要的作用，广泛应用于智能问答、文本生成、代码编写、机器翻译等任务。LLM 是一种基于深度学习的人工智能模型，其核心目标是通过预测下一个单词来理解和生成自然语言。训练 LLM 需要大量的文本数据，使其能够掌握复杂的语言模式并应用于不同任务。接下来，咱们先从较为基础的概念开始。 2.1 LLM 基础概念预训练（Pretraining） LLM 训练通常采用大规模无监督学习，即：1. 从互联网上收集大量文本数据，如书籍、新闻、社交媒体等。2. 让模型学习词语之间的概率分布，理解句子结构。3. 训练目标是最小化预测误差，使其能更好地完成语言任务。 2.3.2 监督微调（Supervised Fine-Tuning, SFT）在预训练之后，通常需要对模型进行监督微调（SFT）：使用人工标注的数

0 码力 | 11 页 | 2.64 MB | 8 月前
3

共 12 条前往

页

分类

语言

格式