DeepSeek从入门到精通(20250204)擅长解决结构化和定义明确的问题 能够处理多维度和非结构化问题,提供创造性的解 决方案 伦理问题 作为受控工具,几乎没有伦理问题 引发自主性和控制问题的伦理讨论 CoT链式思维的出现将大模型分为了两类:“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 适的模型,实现最佳效果。 提示语策略差异 AI输出的要求 和预期。 提示语类型 提示语的本质 1. 指令型提示语:直接告诉AI需要执行的任务。 2. 问答型提示语:向AI提出问题,期望得到相应的 答案。 3. 角色扮演型提示语:要求AI扮演特定角色,模拟 特定场景。 4. 创意型提示语:引导AI进行创意写作或内容生成。 5. 分析型提示语:要求AI对给定信息进行分析和推 理。 6. 多模态提示语:结合文本、图像等多种形式的 提示语的DNA:解构强大提示语的基本元素 提示语的基本元素分类 信息类元素决定了AI在生成过程中需要处理的具体内 容,包括主题、背景、数据等,为AI提供了必要的知 识和上下文。 提示语的基本元素可以根据其功能和作用分为三个大类:信息类元素、结构类元素和控制类元素: 结构类元素用于定义生成内容的组织形式和呈现方式, 决定了AI输出的结构、格式和风格。 控制类元素用于管理和引导AI的生成过程,确保输出 符合0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通擅长解决结构化和定义明确的问题 能够处理多维度和非结构化问题,提供创造性的解 决方案 伦理问题 作为受控工具,几乎没有伦理问题 引发自主性和控制问题的伦理讨论 CoT链式思维的出现将大模型分为了两类:“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 适的模型,实现最佳效果。 提示语策略差异 AI输出的要求 和预期。 提示语类型 提示语的本质 1. 指令型提示语:直接告诉AI需要执行的任务。 2. 问答型提示语:向AI提出问题,期望得到相应的 答案。 3. 角色扮演型提示语:要求AI扮演特定角色,模拟 特定场景。 4. 创意型提示语:引导AI进行创意写作或内容生成。 5. 分析型提示语:要求AI对给定信息进行分析和推 理。 6. 多模态提示语:结合文本、图像等多种形式的 提示语的DNA:解构强大提示语的基本元素 提示语的基本元素分类 信息类元素决定了AI在生成过程中需要处理的具体内 容,包括主题、背景、数据等,为AI提供了必要的知 识和上下文。 提示语的基本元素可以根据其功能和作用分为三个大类:信息类元素、结构类元素和控制类元素: 结构类元素用于定义生成内容的组织形式和呈现方式, 决定了AI输出的结构、格式和风格。 控制类元素用于管理和引导AI的生成过程,确保输出 符合0 码力 | 103 页 | 5.40 MB | 8 月前3
开源中国 2023 大模型(LLM)技术报告向量数据库是专门用于存储和检索向量数据的数据库,它可以为 LLM 提供高效的存储和检索能力。通过数据向量化,实现了 在向量数据库中进行高效的相似性计算和查询。 根据向量数据库的的实现方式,可以将向量数据库大致分为两类: 原生的向量数据库专门为存储和检索向量而设计, 所管理的数据是基于对象或数据点的向量表示进行 组织和索引。 包括 等均属于原生向量数据库。 除了选择专业的向量数据库,对传统数据库添加 “向量支持”也是主流方案。比如 准备任务特定数据:收集与目标任务直接相关的 数据集,这些数据将用于微调模型; 3.微调训练:在任务特定数据上训练预训练的模型, 调整模型参数以适应特定任务; 4.评估:在验证集上评估模型性能,确保模型对新 数据有良好的泛化能力; 5.部署:将性能经验证的模型部署到实际应用中去。 微调的过程也是分类模型训练的过程 (图源:https://medium.com/mlearning-ai/what-is-a-fine 的训练和应用通常使用多种编程语言,取决于任务的需求和团 队的偏好。 。它的广泛使用得 益于其简洁的语法、强大的库支持(如 )和深度学习框架(如 )。 此外, ,C++ 有时 用于优化计算密集型任务,而 Java 在企业环境中处理模型部署和系 统集成方面常见。JavaScript 适用于 Web 环境的 LLM 应用。 13 / 32 LLM 基础设施:编程语言 2023 年是大语言模型0 码力 | 32 页 | 13.09 MB | 1 年前3
DeepSeek图解10页PDF1. 保护隐私与数据安全。数据不外传:本地运行模型可以完全避免数据上 传至云端,确保敏感信息不被第三方访问。 2. 可定制化与优化。支持微调(Fine-tuning):可以根据特定业务需求对模 型进行微调,以适应特定任务,如行业术语、企业内部知识库等。 3. 离线运行,适用于无网络环境。可在离线环境下运行:适用于无互联网 连接或网络受限的场景。提高系统稳定性:即使云服务宕机,本地大模型依 结构的优势 1. 高效的并行计算:摒弃循环结构,使计算速度大幅提升。 2. 更好的上下文理解:注意力机制可捕捉长文本中的远程依赖关系。 3. 良好的可扩展性:可适配更大规模模型训练,增强 AI 泛化能力。 教程作者:郭震,工作 8 年目前美国 AI 博士在读,公众号:郭震 AI,欢迎关注获取更多原创教程。资 料用心打磨且开源,是为了帮助更多人了解获取 AI 知识,严禁拿此资料引流、出书、等形式的商业活动 ed Reinforcement Learn- ing)得到中间推理模型(Iterim reasoning model), 图8会详细解释中间模 型的训练过程。 DeepSeek-R1 核心贡献:首次验证了通过纯强化学习也能大幅提升大模 型推理能力,开源纯强化学习推理模型 DeepSeek-R1-Zero R1-Zero 能生成高质量的推理数据,包括大量长链式思维(Chain-of-Thought0 码力 | 11 页 | 2.64 MB | 8 月前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502企业政企、创业者必读 人工智能发展历程(一) 从早期基于规则的专家系统,走向基于学习训练的感知型AI 从基于小参数模型的感知型AI,走向基于大参数模型的认知型AI 从擅长理解的认知型AI,发展到擅长文字生成的生成式AI 从语言生成式AI,发展到可理解和生成声音、图片、视频的多模态AI 从生成式AI,发展到推理型AI 专家系统 感知AI 认知AI 生成式AI 多模态AI 推理式AI 9政企、创业者必读 人工智能发展历程(二) 从单纯对话的大模型AI,发展到具有行动和执行能力的智能体AI 从数字空间中的AI,走向能理解和操控物理空间的AI 从解决现实问题的AI,走向解决科学问题的科学型AI 大模型AI 智能体AI 物理AI 科学AI 10政企、创业者必读 面对全球大模型产业之争,要打赢「三大战役」 AGI之战 应用场景之战 大模型安全之战 • 探索超越人类的超级人工 智能AGI DeepSeek出现之前的十大预判 之一 传统AGI发展步伐在放慢 需要寻找新方向 Scaling Law边际效应递减 人类训练数据接近枯竭 合成数据无法创造新知识 推理能力难以泛化,成本高昂 全面超越人类的人工智能在逻辑上不成立政企、创业者必读 15 DeepSeek出现之前的十大预判 之二 慢思考成为新的发展模式 大模型发展范式正在从「预训练」转向「后训练」和「推理时计算」0 码力 | 76 页 | 5.02 MB | 6 月前3
人工智能安全治理框架 1.0降。 (c)训练数据标注不规范风险。训练数据标注过程中,存在因标注规则 不完备、标注人员能力不够、标注错误等问题,不仅会影响模型算法准确度、 可靠性、有效性,还可能导致训练偏差、偏见歧视放大、泛化能力不足或输出 错误。 (d)数据泄露风险。人工智能研发应用过程中,因数据处理不当、非授 权访问、恶意攻击、诱导交互等问题,可能导致数据和个人信息泄露。 3.1.3 系统安全风险 (a)缺 台可能存在逻辑缺陷、- 5 - 人工智能安全治理框架 漏洞等脆弱点,还可能被恶意植入后门,存在被触发和攻击利用的风险。 (b)算力安全风险。人工智能训练运行所依赖的算力基础设施,涉及多源、 泛在算力节点,不同类型计算资源,面临算力资源恶意消耗、算力层面风险跨 边界传递等风险。 (c)供应链安全风险。人工智能产业链呈现高度全球化分工协作格局。 但个别国家利用技术垄断和出口管制等单边强制措施制造发展壁垒,恶意阻断 工 智能学科同步发展,依托学校、科研机构等加强人工智能安全设计、开发、治 理人才的培养,支持培养人工智能安全前沿基础领域顶尖人才,壮大无人驾驶、- 12 - 人工智能安全治理框架 智能医疗、类脑智能、脑机接口等领域安全人才队伍。 5.9 建立健全人工智能安全宣传教育、行业自律、社会监督机制。 面向政府、企业、社会公用事业单位加强人工智能安全规范应用的教育培训。 加强人工智能安全风险及0 码力 | 20 页 | 3.79 MB | 1 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单Markdown 表格的形式提供,表格有两列,标题为中文。第一列给出英文标题,第二 列给出中文解释。以下文本为摘要: 【指令后加上文章的摘要】。 中-英、英-中互译指令 指令:我想让你充当一名科研类的英汉翻译,我会向你提供一种语言的一些段落,你的任务是将这些段落准确地、学术性 地翻译成另一种语言。翻译后不要重复原文提供的段落。您应使用人工智能工具(如自然语言处理)以及有关有效写作技巧 的修辞 年 1 1 月 2 9 日 推出670亿参数的通用大模型 D e e p S e e k L L M , 包 括 7 B 和67B的base及chat版本 发 布 新 一 代 推 理 模 型 D e e p S e e k - R 1 , 性 能 与 O p e n A I 的 o 1 正 式 版 持平,并开源 2 0 2 5 年 1 月 2 0 日 2 0 2 4 年 1 2 推理能力专项提升:在除了利用强化学习模型结合跨领域训练提升模 型综合技能以外,还重点提升了模型在数学、代码、逻辑推理等硬核 任务上的能力。 推理过程 DeepSeek R1 在推理过程中采用“深度思考”模式,通过展示完整的 推理路径来提高模型的可解释性和可信度。 在生成答案前展示其推理过 程,让用户看到模型如何分 解问题并得出结论。包括模 型对问题的理解、问题分解、 以及逐步求解的过程。 通过展示推理路径,使得0 码力 | 85 页 | 8.31 MB | 8 月前3
清华大学 普通人如何抓住DeepSeek红利知识推理 • 逻辑问题解答(数学、常识 推 理 ) • 因果分析(事件关联性) 自然语言理解与分析 文本分类 • 文本分类 • 主题标签生成(如新闻分 类) • 垃圾内容检测 Mermaid图表 · 流程图 · 时序图 · 类图 · 状态图 · 实体关系图 · 思维导图 React图表 · 折线图 · 柱状图 · 饼图 · 散点图 · 雷达图 · 组合图表 SVG矢量图 场景4:无人区研究+快速出成果 素数位数关系理论及其思考—— 邵宇捷 各思路具体化及 Python验算 人类提供已有参考案例(拉马努金数、 阿姆斯特朗数等) AI提出可能思路 要求AI迭代调整或人 类介入提供具体设想 AI发现魔法数字的一般过程 思路可用,并非刻 意构造 有刻意构造嫌疑 方案可行 输出结果及理论 体系化 方案不可行 Python验算 无符合数字 有符合数字 “使用你的创意写作能力,创作一个关于时 间旅行的短篇故事” 1. 指令型提示语: 直接告诉AI需要执行的任务 。 2. 问答型提示语: 向AI提出问题, 期望得到相应的 答案 。 3. 角色扮演型提示语: 要求AI扮演特定角色 ,模拟 特定场景 。 4. 创意型提示语: 引导AI进行创意写作或内容生成 。 5. 分析型提示语: 要求AI对给定信息进行分析和推 理0 码力 | 65 页 | 4.47 MB | 8 月前3
普通人学AI指南大家有没有觉得 AI 工具太多,种类太多,老的还没用,新的就出来,头大得 很!有没有这种感觉?所以,在这一章,梳理主流的 AI 工具,注意不是穷举, 那些不经常用的工具,不浪费文字和耽误时间。 梳理总结六大类 AI 工具,分别包括:问答,图像,视频,AI 编程,AI 提 示词和 AI 大模型,一共梳理挑选共计 38 个 AI 工具,其中很多都是开源! 2.1 问答 2.1.1 ChatGPT ChatGPT 界面简洁但因表情符出现又不失枯燥 4 零代码搭建本地 AI 前端 到目前,我们使用大模型的界面还是一个终端窗口,黑乎乎的,交互不友好。 这章教你搭建一个美观炫酷的前端网页,如图 20所示,让你使用本地大模 型,更方便!更舒心!关键搭建简单,顺利的话,三五分钟搞定。后面完全免费 畅享使用大模型! Figure 20: 使用开源 LobeChat 搭建美观的大模型前端界面 19 4.1 LobeChat 件都传入到这个知识库里面,因为都是在本地构建,放心使用,如图 40所示: Figure 40: MaxKB 界面-知识库配置续 35 这里的知识库系统有两种,一种是通用型,也就是自己的文档本地上传,另 一种是 web 站点,用某些网站作为知识库构建的数据来源。在这里根据我的需 求,应该选择通用型。 然后点击进入选择文件夹这里,上传我的 Python 副业代码文件,说明文档, 数据格式可以是 txt、word、pdf、ppt 等,在确定需要上传的文档后,点击图0 码力 | 42 页 | 8.39 MB | 8 月前3
共 9 条
- 1













