【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502互联网创造了能写140个字的推特和分享照片的Instagram AI能帮助人解决登陆火星、能源自由的问题 5政企、创业者必读 大模型是真智能,是人工智能的重大拐点。你相不相信? 大模型是一场工业革命,将重塑所有产品和业务。你相不相信? 不拥抱AI的组织和个人,会被拥抱AI的组织和个人淘汰。你相不相信? 建立AI信仰 6政企、创业者必读 大模型不是泡沫,而是新一轮工业革命的驱动引擎 蒸汽革命 电气革命 信息革命 20政企、创业者必读 21 DeepSeek出现之前的十大预判 之八 智能体推动大模型快速落地 能够调用各种工具,具有行动能力 调用企业专业知识,更懂企业 将日常重复性业务流程形成Playbook,实现流程自动化 通过目标拆解,多次调用大模型以及专家模型协同,形成 慢思考能力 传统软件是辅助人的工具,Agent是能够自主工作的数字员工,是新的生产力政企、创业者必读 22 DeepSeek出现之前的十大预判 低成本低算力需求使得模型更容易被部署到机器人等智能设 备上,解决物理现实世界的认知、决策和行动问题政企、创业者必读 赋予自动驾驶复杂物理世界理解能力 从规则驱动到学习驱动 43政企、创业者必读 人工智能的目标是星辰大海,是为了让人类在科技上有突破 基于DeepSeek的强推理模型,利用科学领域专业知识进行强化学习, 能够打造更加专业的科学推理模型 DeepSeek六大应用方向之五 科学研究:打造科研新范式0 码力 | 76 页 | 5.02 MB | 6 月前3
人工智能安全治理框架 1.0图片、音频、视频等高仿真内容,可能绕过现有人脸识别、语音识别等身份认 证机制,导致认证鉴权失效。 (c)不当使用引发信息泄露风险。政府、企业等机构工作人员在业务工 作中不规范、不当使用人工智能服务,向大模型输入内部业务数据、工业信息, 导致工作秘密、商业秘密、敏感业务数据泄露。 (d)滥用于网络攻击的风险。人工智能可被用于实施自动化网络攻击或- 6 - 人工智能安全治理框架 提高攻击效率,包括挖掘利用 工智能两用物项和 技术,对国家安全、经济安全、公共卫生安全等带来严重风险。包括极大降低 非专家设计、合成、获取、使用核生化导武器的门槛;设计网络武器,通过自 动挖掘与利用漏洞等方式,对广泛潜在目标发起网络攻击。 3.2.3 认知域安全风险 (a)加剧 “信息茧房” 效应风险。人工智能将广泛应用于定制化的信息 服务,收集用户信息,分析用户类型、需求、意图、喜好、行为习惯,甚至特 定 (a)研发者应在需求分析、项目立项、模型设计开发、训练数据选用等 关键环节,切实践行“以人为本、智能向善”理念宗旨,遵循科技伦理规范,采 取开展内部研讨、组织专家评议、科技伦理审查、听取公众意见、与潜在目标 用户沟通交流、加强员工安全教育培训等措施。- 13 - 人工智能安全治理框架 (b)研发者应重视数据安全和个人信息保护,尊重知识产权和版权,确 保数据来源清晰、途径合规。建立完善的数据安全管理制度,确保数据安全性0 码力 | 20 页 | 3.79 MB | 1 月前3
DeepSeek从入门到精通(20250204)文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 适的模型,实现最佳效果。 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 提示语设计 • 推理模型:简洁指令,聚焦目标,信任其内化能力。(“要什么直接说”)。 • 通用模型:结构化、补偿性引导(“缺什么补什么”)。 避免误区 • 不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。 • 不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。 从“下达指令”到“表达需求” 策略类型 定义与目标 适用场景 示例(推理模型适用) 优势与风险0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 适的模型,实现最佳效果。 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 提示语设计 • 推理模型:简洁指令,聚焦目标,信任其内化能力。(“要什么直接说”)。 • 通用模型:结构化、补偿性引导(“缺什么补什么”)。 避免误区 • 不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。 • 不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。 从“下达指令”到“表达需求” 策略类型 定义与目标 适用场景 示例(推理模型适用) 优势与风险0 码力 | 103 页 | 5.40 MB | 8 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单工具,收集并分析市场数据,预测风险并为金 融机构提供管理建议。 • 智能文学创作辅助:为作家提供创作灵感 和文本构思,生成符合中文文学传统的故事情 节和诗句,助力突破创作瓶颈。 • 智能广告创意生成:根据产品特点和目标 受众自动生成创意广告文案和宣传语,提高广 告创作效率。 • 中小企业AI定制化服务:为中小企业提 供定制化的AI解决方案,如智能客服、营销 和办公工具,提升企业竞争力。 • 开源AI教育平台:借助DeepSeek 需进行复 杂操作,等待平台处理完成即可。 综述生成:根据智能分析结果,平台自动生成结构化的文献综述文本内容和可视化图表,用户可直接获取 完整的综述报告,也可根据需要进行自定义调整,如综述主题、目标、参数等。 知网研学平台官网:https://aiplus.cnki.net/sumup/sumup 输入关键词:进入官网后,在搜索框键入关键词进行文献检索。 选取文章:勾选想要分析的20篇文献。 模型蒸馏技术 DeepSeek采用模型蒸馏技术,通过将知识从大型复杂模型 (教师模型)迁移到小型高效模型(学生模型),实现性能和 效率的双重优化。DeepSeek选择了多个开源模型作为蒸馏的 目标模型,包括Qwen 系列和Llama 系列 架构创新 通过将模型划分为多个专家模块,实 现高效计算和推理。DeepSeek通过 无辅助损失的自然负载均衡和共享专 家机制,解决了专家模块工作量不平0 码力 | 85 页 | 8.31 MB | 8 月前3
开源中国 2023 大模型(LLM)技术报告基础设施:大模型框架及微调 (Fine Tuning) 想要微调一个模型,一般包含以下关键步骤: 1.选择预训练模型:选取一个已经在大量数据上进 行过预训练的模型作为起点; 2.准备任务特定数据:收集与目标任务直接相关的 数据集,这些数据将用于微调模型; 3.微调训练:在任务特定数据上训练预训练的模型, 调整模型参数以适应特定任务; 4.评估:在验证集上评估模型性能,确保模型对新 数据有良好的泛化能力; AutoGPT 一个自然 语言目标后,它会尝试将其分解为多个子任务,并在自动循环中使用 互联网和其他工具来实现该目标。它使用的是 OpenAI 的 GPT-4 或 GPT-3.5 API,是首个使用 GPT-4 执行自主任务的应用程序实例。 AutoGPT 最大的特点在于能根据任务指令自主分析和执行,当收到 一个需求或任务时,它会开始分析这个问题,并且给出执行目标和具 体任务,然后开始执行。 SQL、对象存储、主题建模、图形分析和多模 态索引进行矢量搜索。 :专注以 Sketch、PSD、静态 图片等形式的视觉稿作为输入,通过智能化技 术一键生成可维护的前端代码,包含视图代码、 数据字段绑定、组件代码、部分业务逻辑代码。 PromptPerfect 29 / 32 LLM 世界的基石:算力 LLM 的算力指的是执行这些模型所需的计算资源。这包括用于训练和运行模型的硬件(如 GPU 或 TPU)、内存、存储空间以及处理0 码力 | 32 页 | 13.09 MB | 1 年前3
DeepSeek图解10页PDFDeepSeek)具有多个重要的优势,比如: 1. 保护隐私与数据安全。数据不外传:本地运行模型可以完全避免数据上 传至云端,确保敏感信息不被第三方访问。 2. 可定制化与优化。支持微调(Fine-tuning):可以根据特定业务需求对模 型进行微调,以适应特定任务,如行业术语、企业内部知识库等。 3. 离线运行,适用于无网络环境。可在离线环境下运行:适用于无互联网 连接或网络受限的场景。提高系统稳定性:即使云服务宕机,本地大模型依 Model, LLM))的兴起。LLM 在自然语言处理(NLP)领域 发挥着越来越重要的作用,广泛应用于智能问答、文本生成、代码编写、机 器翻译等任务。LLM 是一种基于深度学习的人工智能模型,其核心目标是 通过预测下一个单词来理解和生成自然语言。训练 LLM 需要大量的文本数 据,使其能够掌握复杂的语言模式并应用于不同任务。 接下来,咱们先从较为基础的概念开始。 2.1 LLM 基础概念 预训练(Pretraining) LLM 训练通常采用大规模无监督学习,即:1. 从互联网上收集大量文本数 据,如书籍、新闻、社交媒体等。2. 让模型学习词语之间的概率分布,理解 句子结构。3. 训练目标是最小化预测误差,使其能更好地完成语言任务。 2.3.2 监督微调(Supervised Fine-Tuning, SFT) 在预训练之后,通常需要对模型进行监督微调(SFT):使用人工标注的数0 码力 | 11 页 | 2.64 MB | 8 月前3
国家人工智能产业综合标准化体系建设指南(2024版)彻党的二十大和二十届二中全会精神,认真落实中央经济工 作会议和全国新型工业化推进大会部署要求,完整、准确、 全面贯彻新发展理念,统筹高质量发展和高水平安全,加快 赋能新型工业化,以抢抓人工智能产业发展先机为目标,完 善人工智能标准工作顶层设计,强化全产业链标准工作协 同,统筹推进标准的研究、制定、实施和国际化,为推动我 国人工智能产业高质量发展提供坚实的技术支撑。 到 2026 年,标准与产业科技创新的联动水平持续提升, 算力中心标准。规范面向人工智能的大规模计算集群、 新型数据中心、智算中心、基础网络通信、算力网络、数据存储 8 等基础设施的技术要求和评估方法,包括基础设施参考架构、计 算能力评估、技术要求、稳定性要求和业务服务接口等标准。 6. 系统软件标准。规范人工智能系统层的软硬件技术要求, 包括软硬件编译器架构和优化方法、人工智能算子库、芯片软件 运行时库及调试工具、人工智能软硬件平台计算性能等标准。 70 码力 | 13 页 | 701.84 KB | 1 年前3
普通人学AI指南是一种理论上的人工智能, 它可以理解、学习和应用知识跨越各种不同领域,功能上等同于人类智能。 与专用人工智能(AI)不同,AGI 能够执行任何智力任务,具备自我意识和 自适应学习能力。AGI 的研发目标是创造出可以广泛地模拟人类认知能力的智 能系统。 1.3 大模型 大模型通常指的是大规模的人工智能模型,这类模型通过训练大量的数据来获 得广泛的知识和能力。这些模型通常具有庞大的参数数量,能够处理复杂的任 零代码本地搭建个人知识库 5.1 本地知识库优势 部署本地知识库,可以借助大模型能力,自动检索我们的工作学习文档,实现 对文档内容的实时搜索与问答。 因为大模型、知识库和文档全部运行在本地,所以公司内的业务数据不会泄 密,个人隐私不会泄密,保证这些同时,让:办公效率直接原地起飞! 搭建完成后,实现的效果如图 28: Figure 28: 按照本文教程走完实现的本地知识库效果,大模型 + 个人知识库,0 码力 | 42 页 | 8.39 MB | 8 月前3
清华大学 普通人如何抓住DeepSeek红利理? 可以,但需分阶段“榨干AI效率”,核心策略:框架复制+模块填充+数据嫁接。 分步解决方案: 第一阶段:5分钟——用AI暴力生成框架(目标:3000字) 场景1:1小时内写完一个1万字的项目书 第二阶段:20分钟——用AI批量填充模块(目标:6000字) 针对每个小节单独提问,例如: “写一段‘2.1 功能分区’的内容,要求包含自动化立体仓库、AGV调度中心、冷链专区的技术参数,用数据列表形式 模板复制:对同类章节(如3.1/3.2/3.3)使用相同指令模板,仅替换关键词。 p 强制格式:要求AI输出带编号小标题、分点、表格的内容,直接粘贴后即显“专业感”。 第三阶段:20分钟——用AI补全软性内容(目标:1000字) 填充“虚但必需”的部分: p 政策背书: “生成5条2023年国家层面支持智能物流园区的政策原文(带发文号),并解读对本案的指导意义。” p 风险评估: “列出智能物流园区 通常不会要求你 立刻赶往医院。如果指标比较严重,需要立即行动;否则,可以在家庭和工作 冲突稍缓后,安排陪同父母进行进一步检查。 p 明确背景和身份 p 详细描述各个情境 p 说明你当前的困惑或目标 p 提出具体问题 p 请求分步建议或优先级排序 p 提供更多背景信息(如需要) 情景还原:你是一个白领,面临以下事情:19:00女儿钢琴比赛 vs 跨国并购会议、季度裁员指标压力导致失眠、0 码力 | 65 页 | 4.47 MB | 8 月前3
共 12 条
- 1
- 2













