【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502企业政企、创业者必读 人工智能发展历程(一) 从早期基于规则的专家系统,走向基于学习训练的感知型AI 从基于小参数模型的感知型AI,走向基于大参数模型的认知型AI 从擅长理解的认知型AI,发展到擅长文字生成的生成式AI 从语言生成式AI,发展到可理解和生成声音、图片、视频的多模态AI 从生成式AI,发展到推理型AI 专家系统 感知AI 认知AI 生成式AI 多模态AI 推理式AI 9政企、创业者必读 人工智能发展历程(二) 从单纯对话的大模型AI,发展到具有行动和执行能力的智能体AI 从数字空间中的AI,走向能理解和操控物理空间的AI 从解决现实问题的AI,走向解决科学问题的科学型AI 大模型AI 智能体AI 物理AI 科学AI 10政企、创业者必读 面对全球大模型产业之争,要打赢「三大战役」 AGI之战 应用场景之战 大模型安全之战 • 探索超越人类的超级人工 智能AGI DeepSeek出现之前的十大预判 之一 传统AGI发展步伐在放慢 需要寻找新方向 Scaling Law边际效应递减 人类训练数据接近枯竭 合成数据无法创造新知识 推理能力难以泛化,成本高昂 全面超越人类的人工智能在逻辑上不成立政企、创业者必读 15 DeepSeek出现之前的十大预判 之二 慢思考成为新的发展模式 大模型发展范式正在从「预训练」转向「后训练」和「推理时计算」0 码力 | 76 页 | 5.02 MB | 6 月前3
开源中国 2023 大模型(LLM)技术报告准备任务特定数据:收集与目标任务直接相关的 数据集,这些数据将用于微调模型; 3.微调训练:在任务特定数据上训练预训练的模型, 调整模型参数以适应特定任务; 4.评估:在验证集上评估模型性能,确保模型对新 数据有良好的泛化能力; 5.部署:将性能经验证的模型部署到实际应用中去。 微调的过程也是分类模型训练的过程 (图源:https://medium.com/mlearning-ai/what-is-a-fine 的训练和应用通常使用多种编程语言,取决于任务的需求和团 队的偏好。 。它的广泛使用得 益于其简洁的语法、强大的库支持(如 )和深度学习框架(如 )。 此外, ,C++ 有时 用于优化计算密集型任务,而 Java 在企业环境中处理模型部署和系 统集成方面常见。JavaScript 适用于 Web 环境的 LLM 应用。 13 / 32 LLM 基础设施:编程语言 2023 年是大语言模型 频多种介质,在文本生成、图片生成、AI 编程等方向均 有出色的表现。 GitHub Copilot 16 / 32 大模型应用现状:知名大模型 在全球范围内,已经发布了多款知名大模型,这些大模 型在各个领域都取得了突破性的进展。 处理文本数据的 GPT-4,能同时处理和理解多种类型数 据的多模态模型 DALL-E 3,以及开源大模型的代表 Lllama 2 都在短时间内获得了大量关注和用户,构成了0 码力 | 32 页 | 13.09 MB | 1 年前3
DeepSeek图解10页PDF1. 保护隐私与数据安全。数据不外传:本地运行模型可以完全避免数据上 传至云端,确保敏感信息不被第三方访问。 2. 可定制化与优化。支持微调(Fine-tuning):可以根据特定业务需求对模 型进行微调,以适应特定任务,如行业术语、企业内部知识库等。 3. 离线运行,适用于无网络环境。可在离线环境下运行:适用于无互联网 连接或网络受限的场景。提高系统稳定性:即使云服务宕机,本地大模型依 结构的优势 1. 高效的并行计算:摒弃循环结构,使计算速度大幅提升。 2. 更好的上下文理解:注意力机制可捕捉长文本中的远程依赖关系。 3. 良好的可扩展性:可适配更大规模模型训练,增强 AI 泛化能力。 教程作者:郭震,工作 8 年目前美国 AI 博士在读,公众号:郭震 AI,欢迎关注获取更多原创教程。资 料用心打磨且开源,是为了帮助更多人了解获取 AI 知识,严禁拿此资料引流、出书、等形式的商业活动 ed Reinforcement Learn- ing)得到中间推理模型(Iterim reasoning model), 图8会详细解释中间模 型的训练过程。 DeepSeek-R1 核心贡献:首次验证了通过纯强化学习也能大幅提升大模 型推理能力,开源纯强化学习推理模型 DeepSeek-R1-Zero R1-Zero 能生成高质量的推理数据,包括大量长链式思维(Chain-of-Thought0 码力 | 11 页 | 2.64 MB | 8 月前3
DeepSeek从入门到精通(20250204)AI输出的要求 和预期。 提示语类型 提示语的本质 1. 指令型提示语:直接告诉AI需要执行的任务。 2. 问答型提示语:向AI提出问题,期望得到相应的 答案。 3. 角色扮演型提示语:要求AI扮演特定角色,模拟 特定场景。 4. 创意型提示语:引导AI进行创意写作或内容生成。 5. 分析型提示语:要求AI对给定信息进行分析和推 理。 6. 多模态提示语:结合文本、图像等多种形式的 Reframe(重构):用新视角看待问题 • Interconnect(互联):建立领域间的联系 • Decontextualize(去情境化):将概念从原始环 境中抽离 • Generalize(泛化):寻找普适原则 • Extrapolate(推演):将原理应用到新领域 �实战技巧:操作方法 1. 使用“评估矩阵”提示进行系统性筛选 2. 应用“优化循环”提示迭代改进想法 3. 设计“创意组合”提示融合不同概念 说明 陈述型 8 提供关于气候变化的事实和数据 指令型 7 鼓励读者采取环保行动 表达型 6 表达对气候变化的关切 承诺型 3 提出未来行动的建议 宣告型 1 不适用于此文章 任务目标:创作一篇关于气候变化的文章,旨在提高公众意识并促进行动。 主要语用意图: (1)陈述型(强度8):提供可靠的气候变化数据和科学发现。 (2)指令型(强度7):鼓励读者采取具体的环保行动。0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通AI输出的要求 和预期。 提示语类型 提示语的本质 1. 指令型提示语:直接告诉AI需要执行的任务。 2. 问答型提示语:向AI提出问题,期望得到相应的 答案。 3. 角色扮演型提示语:要求AI扮演特定角色,模拟 特定场景。 4. 创意型提示语:引导AI进行创意写作或内容生成。 5. 分析型提示语:要求AI对给定信息进行分析和推 理。 6. 多模态提示语:结合文本、图像等多种形式的 Reframe(重构):用新视角看待问题 • Interconnect(互联):建立领域间的联系 • Decontextualize(去情境化):将概念从原始环 境中抽离 • Generalize(泛化):寻找普适原则 • Extrapolate(推演):将原理应用到新领域 �实战技巧:操作方法 1. 使用“评估矩阵”提示进行系统性筛选 2. 应用“优化循环”提示迭代改进想法 3. 设计“创意组合”提示融合不同概念 说明 陈述型 8 提供关于气候变化的事实和数据 指令型 7 鼓励读者采取环保行动 表达型 6 表达对气候变化的关切 承诺型 3 提出未来行动的建议 宣告型 1 不适用于此文章 任务目标:创作一篇关于气候变化的文章,旨在提高公众意识并促进行动。 主要语用意图: (1)陈述型(强度8):提供可靠的气候变化数据和科学发现。 (2)指令型(强度7):鼓励读者采取具体的环保行动。0 码力 | 103 页 | 5.40 MB | 9 月前3
人工智能安全治理框架 1.0降。 (c)训练数据标注不规范风险。训练数据标注过程中,存在因标注规则 不完备、标注人员能力不够、标注错误等问题,不仅会影响模型算法准确度、 可靠性、有效性,还可能导致训练偏差、偏见歧视放大、泛化能力不足或输出 错误。 (d)数据泄露风险。人工智能研发应用过程中,因数据处理不当、非授 权访问、恶意攻击、诱导交互等问题,可能导致数据和个人信息泄露。 3.1.3 系统安全风险 (a)缺 台可能存在逻辑缺陷、- 5 - 人工智能安全治理框架 漏洞等脆弱点,还可能被恶意植入后门,存在被触发和攻击利用的风险。 (b)算力安全风险。人工智能训练运行所依赖的算力基础设施,涉及多源、 泛在算力节点,不同类型计算资源,面临算力资源恶意消耗、算力层面风险跨 边界传递等风险。 (c)供应链安全风险。人工智能产业链呈现高度全球化分工协作格局。 但个别国家利用技术垄断和出口管制等单边强制措施制造发展壁垒,恶意阻断0 码力 | 20 页 | 3.79 MB | 1 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单年 1 1 月 2 9 日 推出670亿参数的通用大模型 D e e p S e e k L L M , 包 括 7 B 和67B的base及chat版本 发 布 新 一 代 推 理 模 型 D e e p S e e k - R 1 , 性 能 与 O p e n A I 的 o 1 正 式 版 持平,并开源 2 0 2 5 年 1 月 2 0 日 2 0 2 4 年 1 2 推理能力专项提升:在除了利用强化学习模型结合跨领域训练提升模 型综合技能以外,还重点提升了模型在数学、代码、逻辑推理等硬核 任务上的能力。 推理过程 DeepSeek R1 在推理过程中采用“深度思考”模式,通过展示完整的 推理路径来提高模型的可解释性和可信度。 在生成答案前展示其推理过 程,让用户看到模型如何分 解问题并得出结论。包括模 型对问题的理解、问题分解、 以及逐步求解的过程。 通过展示推理路径,使得 决了纯强化学习训练中可能出现的可读性差和语言混杂等问题。 第一阶段:推理 导向的强化学习 基 于 冷 启 动 数 据 微 调 后 的 基 础 模 型 , 进 行 大 规 模 强 化 学 习 。 此 阶 段 引 入 语 言 一 致 性 奖 励 , 优 化 模 型 在 数 学 、 编 程 等 结 构 化 任 务 中 的表现。 第二阶段:拒绝 采样与监督微调 通 过 拒 绝 采 样 从 R L0 码力 | 85 页 | 8.31 MB | 8 月前3
清华大学 普通人如何抓住DeepSeek红利“使用你的创意写作能力,创作一个关于时 间旅行的短篇故事” 1. 指令型提示语: 直接告诉AI需要执行的任务 。 2. 问答型提示语: 向AI提出问题, 期望得到相应的 答案 。 3. 角色扮演型提示语: 要求AI扮演特定角色 ,模拟 特定场景 。 4. 创意型提示语: 引导AI进行创意写作或内容生成 。 5. 分析型提示语: 要求AI对给定信息进行分析和推 理0 码力 | 65 页 | 4.47 MB | 8 月前3
普通人学AI指南界面简洁但因表情符出现又不失枯燥 4 零代码搭建本地 AI 前端 到目前,我们使用大模型的界面还是一个终端窗口,黑乎乎的,交互不友好。 这章教你搭建一个美观炫酷的前端网页,如图 20所示,让你使用本地大模 型,更方便!更舒心!关键搭建简单,顺利的话,三五分钟搞定。后面完全免费 畅享使用大模型! Figure 20: 使用开源 LobeChat 搭建美观的大模型前端界面 19 4.1 LobeChat 件都传入到这个知识库里面,因为都是在本地构建,放心使用,如图 40所示: Figure 40: MaxKB 界面-知识库配置续 35 这里的知识库系统有两种,一种是通用型,也就是自己的文档本地上传,另 一种是 web 站点,用某些网站作为知识库构建的数据来源。在这里根据我的需 求,应该选择通用型。 然后点击进入选择文件夹这里,上传我的 Python 副业代码文件,说明文档, 数据格式可以是 txt、word、pdf、ppt 等,在确定需要上传的文档后,点击图0 码力 | 42 页 | 8.39 MB | 8 月前3
共 9 条
- 1













