DeepSeek从入门到精通(20250204)· 如何使用Deepseek? ## DeepSeek是什么? - DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 uments/f/3/7/0/f37064274bc52e8d62ab0d2bc829c32d/p9_2.jpg) ## 如何从入门到精通? 当人人都会用AI时,你如何用得更好更出彩? ## 推理模型 推理大模型:推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。 例如: 处理,而不强调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像推理模型那样复杂的推理和决策能力。 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译等任务。 |维度|推理模型|通用模型| |---|---|---| |优势领域|数学推导、逻辑分析、代码生成、复杂问题拆解|文本生成、创意写作、多轮对话、开放性问答|0 码力 | 104 页 | 5.37 MB | 1 年前3
清华大学 DeepSeek 从入门到精通· 如何使用Deepseek? ## DeepSeek是什么? - DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 uments/5/1/3/f/513f8baf8f2fc5547b0250d9608bf2de/p9_3.jpg) ## 如何从入门到精通? 当人人都会用AI时,你如何用得更好更出彩? ## 推理模型 推理大模型:推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。 例如: 处理,而不强调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像推理模型那样复杂的推理和决策能力。 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译等任务。 |维度|推理模型|通用模型| |---|---|---| |优势领域|数学推导、逻辑分析、代码生成、复杂问题拆解|文本生成、创意写作、多轮对话、开放性问答|0 码力 | 103 页 | 5.40 MB | 1 年前3
DeepSeek图解10页PDFDeepSeek-R1 精华图解 …… 7 3.1 DeepSeek-R1 完整训练过程 …… 7 3.1.1 核心创新 1:含 R1-Zero 的中间推理模型 …… 8 3.1.2 核心创新 2:通用强化学习 …… 8 3.2 含 R1-Zero 的中间推理模型训练过程 …… 9 3.3 通用强化学习训练过程 …… 10 3.4 总结 DeepSeek-R1 …… 11 4 参考文献 云服务宕机,本地大模型依然可以正常工作,不受外部因素影响。 ## 本教程搭建 DeepSeek 好处 本地搭建 DeepSeek 三个比较实际的好处: • 本教程接入的是 DeepSeek 推理模型 R1,开源免费,性能强劲 • 本教程搭建方法零成本,不需花一分钱。 - 为了照顾到大部分读者,推荐的搭建方法已将电脑配置要求降到最低,普通电脑也能飞速运行。 ### 1.2 DeepSeek 1:含 R1-Zero 的中间推理模型 如图7所示,推理导向的强化学习(Reasoning-Oriented Reinforcement Learning)得到中间推理模型(Iterim reasoning model),图8会详细解释中间模型的训练过程。 DeepSeek-R1 核心贡献:首次验证了通过纯强化学习也能大幅提升大模型推理能力,开源纯强化学习推理模型 DeepSeek-R1-Zero0 码力 | 11 页 | 2.64 MB | 1 年前3
清华大学 普通人如何抓住DeepSeek红利价值创造,成为社会发展的持续动力。 ## DeepSeek是什么? • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。 DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正式版。 - DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代 。 4. 提前准备:在沟通前,整理好自己的观点和感受,避免情绪化表达。 5. 引入专业资源:如需要,可以寻求律师或家庭顾问的帮助,确保遗产分配的合法性和公正性。 ## 提示语策略差异 ## 推理模型 - 提示语更简洁,只需明确任务目标和需求(因其已内化推理逻辑)。 - 无需逐步指导,模型自动生成结构化推理过程(若强行拆解步骤,反而可能限制其能力)。 ## 2 ## 通用模型 - 需显式引导推理步骤(如通过CoT提示),否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板(如要求分步思考、提供示例)。 ## 从 “下达指令” 到 “表达需求” |策略类型|定义与目标|适用场景|示例(推理模型适用)|优势与风险| |---|---|---|---|---| |指令驱动|直接给出明确步骤或格式要求|简单任务、需快速执行|“用Python编写快速排序函数,输出需包含注释。”|结果精准高效限制模型自主优化空间|0 码力 | 65 页 | 4.47 MB | 1 年前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502预训练大模型 → 推理大模型 预训练模型如GPT——疯狂读书,积累知识,Scaling law撞墙 ➢ 预训练模型思考深度不够 算力见顶,变成少数巨头游戏 预训练大模型难以通往AGI之路 > 推理模型如R1——通过逻辑链条推导答案, > 分解规划,自我反思 ➢ 预训练范式像是记忆和模仿,强化学习范式更像探索实践 记住很多东西只是基础,真正有价值的是融会贯通 R1找到了人类通往AGI的方向 快 人类真正智力表现的形式 例:课后作业、仔细思考 GPT、DeepSeek-V3擅长的思考方式 长思维链强大的推理能力是真正人类智力的体现 ➢ 预训练大模型是人记忆和学习的能力,推理模型是对复杂问题进行规划、分解、预测的能力,实现了真正的慢思考 # DeepSeek颠覆式创新——技术创新 ## DeepSeek-R1是AI发展史上的重要里程碑 ## Alpha Zero时刻 测 # DeepSeek六大应用方向之五 ## 科学研究:打造科研新范式 人工智能的目标是星辰大海,是为了让人类在科技上有突破 基于DeepSeek的强推理模型,利用科学领域专业知识进行强化学习, 能够打造更加专业的科学推理模型 ## AI For Science,为基础科学带来革命性变化 ## 2024 诺贝尔化学奖颁发给研发AlphaFold的两位AI专家未来所有科学研究都将以AI为中心0 码力 | 76 页 | 5.02 MB | 1 年前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单h 基本知识介绍 ## DeepSeek:颠覆出圈,霸榜热议 DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。 DeepSeek-R1是其最新发布并开源的推理模型,擅长处理复杂任务且可免费商用,其性能在多个基准测试中表现出色,对齐OpenAI-O1正式版,甚至在某些任务上表现更优。 ## 我是 DeepSeek,很高兴见到你! 我可以帮你写代码、读文件 LLM,包括7B和67B的base及chat版本 2024年12月26日 发布总参数达6710亿的DeepSeek-V3,采用创新MoE架构和FP8混合精度训练,训练成本大幅降低 2025年1月20日 发布新一代推理模型DeepSeek-R1,性能与OpenAI的o1正式版持平,并开源 ## 推理能力:核心突破,专项升级 DeepSeek R1 的核心突破在于其通过强化学习驱动的推理能力。该模型 强化学习技术,显著提升模型的推理能力,使其在数学、编程和自然语言推理等任务上表现出色。 ## 推理能力 • 强化学习驱动:DeepSeek R1-Zero 是首个完全基于强化学习(RL)训练的推理模型,无需任何监督微调(SFT)步骤,打破传统模型依赖大量标注数据的惯例。DeepSeek-R1 采用强化学习作为核心训练方法,显著提升了模型的推理能力和语言表达的可读性。 - 推理能力专项提升:在0 码力 | 85 页 | 8.31 MB | 1 年前3
DeepSeek-R1使用指南(简版)https://api.deepseek.com/v1 来使用。也就是说上一个用不了再试试这个。 ## 第三个就是模型: ☐ deepseek-reasoner 是 DeepSeek 最新推出的推理模型 DeepSeek-R1。通过指定 model='deepseek-reasoner',即可调用 DeepSeek-R1。 ☐ 通过指定 model='deepseek-chat'0 码力 | 25 页 | 5.57 MB | 1 年前3
《TensorFlow 2项目进阶实战》6-业务落地篇:实现货架洞察Web应⽤Edit View Run Kernel Tabs Settings Help |\+|\+|C|ai\_pipeline.ipynb|×| |---|---|---|---|---| ## 加载检测推理模型 detector File Edit View Run Kernel Tabs Settings Help  ## DeepSeek 三种模式对比 • 基础模型(V3):通用模型(2024.12),高效便捷,适用于绝大多数任务,“规范性”任务 • 深度思考(R1):推理模型,复杂推理和深度分析任务,如数理逻辑推理和编程代码,“开放性”任务 • 联网搜索:RAG(检索增强生成),知识库更新至2024年7月 V3 还是 R1?过程驱动(规范约束)还是结果驱动(模糊目标)?0 码力 | 35 页 | 9.78 MB | 1 年前3
2024 中国开源开发者报告的场景变为现实。 一般认为, 同时具备 GPT-4o 多模态能力和 o1 推理能力的模型就可以满足个人模型的需求, 目前国内的头部 AI 公司也已接近个人模型的技术目标。但目前端到端多模态模型和推理模型的成本仍然较高, 且在一些场景下还不够稳定。 但 2023 年以来,模型知识密度有每 8 个月提升一倍的“类摩尔定律”趋势,加上硬件的摩尔定律和推理框架的优化,一到两年后,个人模型的成本将达到可0 码力 | 111 页 | 11.44 MB | 1 年前3
共 10 条
- 1













