【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502政企、创业者必读 国内DeepSeek最前沿资料 政企、创业者必读 《DeepSeek给我们带来的创业机会》 360集团创始人 周鸿祎 3 政企、创业者必读政企、创业者必读 一张图读懂一堂DeepSeek课政企、创业者必读 AI给了一个比互联网更大的机会 互联网是连接平台,人工智能是生产力 互联网是赋能性技术,生产力属性较弱 人工智能既能单兵作战,也能外部赋能 互联网 互联网创造了能写140个字的推特和分享照片的Instagram AI能帮助人解决登陆火星、能源自由的问题 5政企、创业者必读 大模型是真智能,是人工智能的重大拐点。你相不相信? 大模型是一场工业革命,将重塑所有产品和业务。你相不相信? 不拥抱AI的组织和个人,会被拥抱AI的组织和个人淘汰。你相不相信? 建立AI信仰 6政企、创业者必读 大模型不是泡沫,而是新一轮工业革命的驱动引擎 蒸汽革命 电气革命 信息革命 以大模型为代表的 注入强大动能 大模型的进一步突破将引领人类社会进入智能化时代,对我们的生活方式、生产方式带来巨大变革 重塑经济图景 解决复杂问题 7政企、创业者必读 8 AI不仅是技术革新,更是思维方式和社会结构的变革 国家 产业 个人 企业政企、创业者必读 人工智能发展历程(一) 从早期基于规则的专家系统,走向基于学习训练的感知型AI 从基于小参数模型的感知型AI,走向基于大参数模型的认知型AI0 码力 | 76 页 | 5.02 MB | 6 月前3
开源中国 2023 大模型(LLM)技术报告为大模型提供高效的存储和检索能力 大模型框架及微调 (Fine Tuning) 大模型框架提供基本能力和普适性,而微调 则是实现特定应用和优化性能的关键环节 大模型训练平台&工具 提供了在不同硬件和环境中训练大语言模型 所需的基础设施和支持 编程语言 以 Python 为代表 5 / 32 LLM 基础设施:向量数据库/数据库向量支持 向量数据库是专门用于存储和检索向量数据的数据库,它可以为 LLM 基础设施:向量数据库/数据库向量支持 自 2022 年 ChatGPT 问世以来,大模型星火初始,向量数据 库不但获得了技术领域的关注,也逐渐吸引了市场和资本的注 意力。近两年来,向量数据库公司迎来了一波融资潮: Pinecone:已融资 Zilliz:已融资 Weaviate:已融资 Vespa:已融资 Chroma:已融资 Qdrant:已融资 Marqo:已融资 LanceDB:已融资 …… 据西南证券研究发展中心预测,2025 年向量数据库渗透率约 为 30%,则全球向量数据库市场规模约为 99.5 亿美元, 。 2023 年前四个月,向量数据库公司融资额 ,超过了 2022 年的总和 (图源:https://www.cbinsights.com/research/generative-ai-infrastructure- vector-database/)0 码力 | 32 页 | 13.09 MB | 1 年前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单1 0 亿 的 D e e p S e e k - V 3 , 采 用 创 新 MoE架构和FP8混合精度训练, 训练成本大幅降低 DeepSeek是一家专注通用人工智能(AGl)的中国科技公司,主攻大模型研发与应用。 DeepSeek-R1是其最新发布并开源的推理模型,擅长处理复杂任务且可免费商用,其性能 在多个基准测试中表现出色,对齐OpenAI-O1正式版,甚至在某些任务上表现更优。 通过技术创新和优化策略,大幅降低了模型训练和推理 成本,使其在性价比上远超 OpenAI 等竞争对手。 训练成本:DeepSeek V3 的训练成本仅为 557.6 万美元,远低于 其他国际大公司的训练成本。这种低成本策略使得更多企业和开发 者能够负担得起高性能 AI 模型的训练和使用。 调用成本:DeepSeek R1 的 API 服务定价为每百万输入 tokens 1 元(缓存命中)/4 DeepSeek的本地部署与云端计算相结合,实现高效的计算和传 输。例如,其蒸馏模型在端侧SoC(系统级芯片)上的表现,显 著降低了硬件门槛,同时提升了用户体验。 DeepSeek的本地部署在性能上表现出色,能够满足不同应用场景的需求,尤其是在端侧和端云协同场景。通过合理的 硬件配置和优化策略,DeepSeek可以在本地环境中高效运行,为用户提供强大的AI支持。 DeepSeek 在端侧部署中展现出较强的适应性和灵活性。0 码力 | 85 页 | 8.31 MB | 8 月前3
Deepseek R1 本地部署完全手册模型。本⼿册 为技术团队提供完整的本地部署指南,涵盖硬件配置、国产芯⽚适配、量化⽅案、云端替代⽅ 案及完整671B MoE模型的Ollama部署⽅法。 核⼼提示: 个⼈⽤户:不建议部署32B及以上模型,硬件成本极⾼且运维复杂。 企业⽤户:需专业团队⽀持,部署前需评估ROI(投资回报率)。 ⼆、本地部署核⼼配置要求 1. 模型参数与硬件对应表 模型参 数 Windows 配置要求 Mac FP8 ≥890GB 2*XE9680(16*H20 GPU) DeepSeek-R1-Distill- 70B 70B BF16 ≥180GB 4*L20 或 2*H20 GPU 三、国产芯⽚与硬件适配⽅案 1. 国内⽣态合作伙伴动态 企业 适配内容 性能对标(vs NVIDIA) 华为昇 腾 昇腾910B原⽣⽀持R1全系列,提供端到端推理优化 ⽅案 等效A100(FP16) 沐曦 GPU MXN系列⽀持70B模型BF16推理,显存利⽤率提升 30% 等效RTX 3090 海光 DCU 适配V3/R1模型,性能对标NVIDIA A100 等效A100(BF16) 2. 国产硬件推荐配置 模型参数 推荐⽅案 适⽤场景 1.5B 太初T100加速卡 个⼈开发者原型验证 14B 昆仑芯K200集群 企业级复杂任务推理 32B 壁彻算⼒平台+昇腾910B集群 科研计算与多模态处理0 码力 | 7 页 | 932.77 KB | 8 月前3
国家人工智能产业综合标准化体系建设指南(2024版)智能软件开源基础框架,人工智能系统能效评价,人工智能与资 7 源利用、碳排放、废弃部件处置等标准。 (二)基础支撑标准 基础支撑标准主要包括基础数据服务、智能芯片、智能传感 器、计算设备、算力中心、系统软件、开发框架、软硬件协同等 标准。 1. 基础数据服务标准。规范人工智能研发、测试、应用等 过程中涉及数据服务的要求,包括数据采集、数据标注、数据治 理、数据质量等标准。 2. 智能芯片标准。规范智能芯片相关的通用技术要求,包 系统软件标准。规范人工智能系统层的软硬件技术要求, 包括软硬件编译器架构和优化方法、人工智能算子库、芯片软件 运行时库及调试工具、人工智能软硬件平台计算性能等标准。 7. 开发框架标准。规范人工智能开发框架相关的技术要求, 包括开发框架的功能要求,与应用系统之间的接口协议、神经网 络模型表达和压缩等标准。 8. 软硬件协同标准。规范智能芯片、计算设备等硬件与系 统软件、开发框架等软件之间的适配要求,包括智能芯片与开发 统软件、开发框架等软件之间的适配要求,包括智能芯片与开发 框架的适配要求、人工智能计算任务调度、分布式计算等软硬件 协同任务的交互协议、执行效率和协同性能等标准。 (三)关键技术标准 关键技术标准主要包括机器学习、知识图谱、大模型、自然 语言处理、智能语音、计算机视觉、生物特征识别、人机混合增 强智能、智能体、群体智能、跨媒体智能、具身智能等标准。 1. 机器学习标准。规范机器学习的训练数据、数据预处理、0 码力 | 13 页 | 701.84 KB | 1 年前3
清华大学 普通人如何抓住DeepSeek红利决策行为实现价值创造,成为社会发 展的持续动力。 善用DeepSeek的两大关键:提出问题 鉴别答案 DeepSeek是什么? • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正 式版。 • DeepSeek-R1在后训练阶段大规模使用了强化 上掩盖文字密度不足。标题字体放大、段落间距调宽,快速“膨胀”页数。 ü 若有时间,再精雕细琢 场景2:新员工快速熟悉公司情况和行业情况 场景:小李刚刚加入一家制造电子元器件的公司,作为一个新员工,他需要在短时间内熟悉公司的产品线、组织 结构、内部系统以及行业情况。然而,公司的产品手册复杂,部门间的职责不清晰,内部系统操作繁琐,行业信 息量庞大,这些都让小李感到不知所措。他担心自己无法在短时间内快速上手,影响工作效率和表现。 依赖同事的口头介绍,容易遗漏重要信 息。 • 手动查阅厚重的产品手册和内部文档, 耗时较长。 • 参加多部门的培训,但信息量大,难以 消化。 • 通过网络搜索行业信息,但信息分散, 难以整合。 场景2:新员工快速熟悉公司情况和行业情况 快速了解行业情况和市场趋势 DeepSeek可以整合行业报告、市场分析、竞争对手信 息等数据,帮助新员工快速掌握行业动态。 操作步骤 上传行业报告、市场分析文档、竞争对手资料等到0 码力 | 65 页 | 4.47 MB | 8 月前3
普通人学AI指南. 8 2.3 AI 视频工具 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.3.1 Sora (OpenAI 公司) . . . . . . . . . . . . . . . . . . . . . 8 2.3.2 Runway . . . . . . . . . . . . . . . . . . . . 问答工具 ChatGPT 经过特别训练,可以理解和生成人类语言,从而在多种应用场景中提 供辅助,包括聊天机器人、写作辅助、信息查询等。 2.1.2 Claude Claude 是 Anthropic 公司开发的一系列大型语言模型,它设计用于执行多种涉 及语言、推理、分析和编码的任务。 2.1.3 通义千问 通义千问(Qwen)是阿里云开发的一系列预训练的大型语言模型,用于聊天、 生成内容、提取信 2.6 Midjourney 闭源:由一个小团队开发的闭源 AI,专注于生成创意和艺术图像。 2.3 AI 视频工具 Figure 5: AI 视频工具 2.3.1 Sora (OpenAI 公司) 内测:由 OpenAI 开发,目前处于内部测试阶段的项目。 8 2.3.2 Runway 闭源:一个闭源的创意工具,支持通过 AI 进行视频编辑和生成。 2.3.3 Pika 闭源的图像编辑工具,专注于简化图像处理流程。0 码力 | 42 页 | 8.39 MB | 8 月前3
00 Deepseek官方提示词号运载火箭最短发射间隔纪录。 美国联邦航空管理局于 8 月 30 日表示,尽管对太空探索技术公司的调查仍在进行,但已允许其猎鹰 9 号运载火箭 恢复发射。目前,双方并未透露 8 月 28 日助推器着陆失败事故的详细信息。尽管发射已恢复,但原计划进行五天 “ ” 太空活动的 北极星黎明 (Polaris Dawn)任务却被推迟。美国太空探索技术公司为该任务正在积极筹备,等 待美国联邦航空管理局的最终批准后尽快进行发射。 - 健康 - 国际 - 国内 - 社会 #### 使用说明 - 输入 :一段新闻文本。 - 输出 :只输出新闻文本所属的种类,不需要额外解释。 USER 美国太空探索技术公司(SpaceX)的猎鹰 9 号运载火箭(Falcon 9)在经历美国联邦航空管理局(Federal Aviation Administration,FAA)短暂叫停发射后,于当地时间 8 月 310 码力 | 4 页 | 7.93 KB | 8 月前3
人工智能安全治理框架 1.0(c)加强人工智能算力平台和系统服务的安全建设、管理、运维能力, 确保基础设施和服务运行不中断。 (d)对于人工智能系统采用的芯片、软件、工具、算力和数据资源,应 高度关注供应链安全。跟踪软硬件产品的漏洞、缺陷信息并及时采取修补加固 措施,保证系统安全性。 4.2 针对人工智能应用安全风险 4.2.1 网络域风险应对 (a)建立安全防护机制,防止模型运行过程中被干扰、篡改而输出不可 交互等方面组织研究人工智能决策透明度、可信度、纠错机制等问题,不断提 高人工智能可解释性和可预测性,避免人工智能系统意外决策产生恶意行为。 5.7 人工智能安全风险威胁信息共享和应急处置机制。持续跟踪分析 人工智能技术、软硬件产品、服务等方面存在的安全漏洞、缺陷、风险威胁、 安全事件等动向,协调有关研发者、服务提供者建立风险威胁信息通报和共享 机制。构建人工智能安全事件应急处置机制,制定应急预案,开展应急演练, 及时快速有效处置人工智能安全威胁和事件。0 码力 | 20 页 | 3.79 MB | 1 月前3
DeepSeek从入门到精通(20250204)Deepseek能够做什么? • 如何使用Deepseek? DeepSeek是什么? AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应 用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语 源:[明确数据来源和依据,确 保真实性] 项目亮点 请列举过去一年中 参与的重要项目及 其成果,展示在项 目中的角色和贡献。 关键项目:[列举项目名称、目 标、结果及自己的角色]影响力: [项目如何推动了部门或公司目 标的实现,具体成果如何体现] 成就展示 未来规划 成就展示部分应突出个人和团队在过 去一年的创新、突破及贡献,提示语 设计应侧重: • 团队贡献 • 创新与突破 • 个人荣誉 未来规划部分是年终总结的重点,旨0 码力 | 104 页 | 5.37 MB | 8 月前3
共 11 条
- 1
- 2













