DeepSeek-R1 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

DeepSeek-R1使用指南（简版）

1cff0a/p1_3.jpg) DeepSeek-R1 凭借着强大的性能和优秀的表现，在各大评测榜单中名列前茅，吸引了众多 AI 爱好者的关注。很多小伙伴可能跃跃欲试，却苦于不知如何下手。别担心，这篇教程将手把手教你如何使用DeepSeek-R1，主要介绍网页端和 API 两种方式，让你轻松玩转这款强大的 AI 模型！ ## DeepSeek-R1 有什么厉害之处？在正式开始之前，我们先来简单了解一下DeepSeek 在正式开始之前，我们先来简单了解一下DeepSeek R1的亮点：不了解了，直接说最值得说的： DeepSeek-R1 通过使用多阶段循环的训练方式：基础→RL→微调→RL→微调→RL，极大加强了大模型的深度思考能力。先看看一个例子。提问：创造一个复杂的反派角色，他的每一个恶行背后都有令人同情的理由，同时他自己认为是正义的。请为这个角色设计一个具体的背景故事和驱动力。创造一个复杂的反派角色，他的每一 caee11cff0a/p8_2.jpg) ## 一、网页端：无需代码，即点即用！对于大多数用户来说，网页端是最方便快捷的使用方式。你无需任何编程基础，只需打开浏览器，就可以与 DeepSeek-R1 进行互动。 ## 如何使用？ 1. 访问 DeepSeek 官方网站：打开 http://chat.deepseek.com/，然后注册登录，手机号或者微信扫码。 ![Image](/

0 码力 | 25 页 | 5.57 MB | 1 年前
3
DeepSeek图解10页PDF

3 DeepSeek-R1 精华图解 …… 7 3.1 DeepSeek-R1 完整训练过程 …… 7 3.1.1 核心创新 1：含 R1-Zero 的中间推理模型 …… 8 3.1.2 核心创新 2：通用强化学习 …… 8 3.2 含 R1-Zero 的中间推理模型训练过程 …… 9 3.3 通用强化学习训练过程 …… 10 3.4 总结 DeepSeek-R1 …… 11 第二步, 命令窗口输入: ollama pull deepseek-r1:1.5b, 下载大模型 deepseek-r1 到我们自己的电脑, 如下图3所示: ![Image](/uploads/documents/1/3/b/2/13b20a9d4838b5b1de0203b8a947d471/p3_3.jpg) 图 3: DeepSeek-r1 下载到本地电脑命令教程作者：郭震，工作8 terminal(苹果电脑) 执行命令：ollama run deepseek-r1:1.5b，很快就能进入对话界面，如下图4所示： ![Image](/uploads/documents/1/3/b/2/13b20a9d4838b5b1de0203b8a947d471/p4_1.jpg) 图 4: Ollama 软件启动 deepseek-r1 界面 ### 1.3 DeepSeek 本地运行使用演示

0 码力 | 11 页 | 2.64 MB | 1 年前
3
Deepseek R1 本地部署完全手册

(需多卡并联)|暂不支持|科研计算、大规模数据处理| ### 2. 算力需求分析 |模型|参数规模|计算精度|最低显存需求|最低算力需求| |---|---|---|---|---| |DeepSeek-R1 (671B)|671B|FP8|≥890GB|2\*XE9680 (16\*H20 GPU)| |DeepSeek-R1-Distill-70B|70B|BF16|≥180GB|4\*L20 6. 英伟达NIM: https://build.nvidia.com/deepseek-ai/deepseek-r1 7. Groq: https://groq.com/ 8. Fireworks: https://fireworks.ai/models/fireworks/deepseek-r1 9. Chutes: https://chutes.ai/app/chute/ 10. Github: Github: https://github.com/marketplace/models/azureml-deepseek/DeepSeek-R1/playground 11. POE: https://poe.com/DeepSeek-R1 12. Cursor: https://cursor.sh/ 13. Monica: https://monica.im/invitation?c=ACZ7WJJ9

0 码力 | 7 页 | 932.77 KB | 1 年前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

DeepSeek出现之前的十大预判之五知识的质量和密度决定大模型能力高质量数据、合成数据使模型知识密度的快速增长 ➢ 大模型能以更少的参数量达到更高的性能 360联合北大研发：5%参数量逼近Deepseek-R1满血性能 ## DeepSeek出现之前的十大预判之六成本越来越低过去一年，大模型成本「自由落体」国外：GPT-4等效智能在过去18个月内价格下降240倍国内：大模型「亏本」卖，可以「白嫖」大模型API能力市场推广创新——让过去很难得到的东西可以得到商业模式创新——让过去很昂贵的东西变得很便宜甚至免费 DeepSeek正是符合这四种创新模式的完美例子 ## DeepSeek颠覆式创新——技术创新 DeepSeek-R1突破了大模型Scaling Law瓶颈大数据+大参数+大算力的预训练Scaling Law的边际效应递减 • 人类构造的训练数据已达上限 - 万亿参数规模之后，继续增大参数规模难以带来质的提升通过后训练算力和推理算力，在不增加预训练算力前提下，大幅提升模型性能开辟强化学习新范式从预训练Scaling Law转变为强化学习Scaling Law ## DeepSeek颠覆式创新——技术创新 DeepSeek-R1和GPT-4o不是同一个物种预训练大模型 → 推理大模型预训练模型如GPT——疯狂读书，积累知识，Scaling law撞墙 ➢ 预训练模型思考深度不够算力见顶，变成少数巨头游戏

0 码力 | 76 页 | 5.02 MB | 1 年前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

DeepSeek+DeepResearch 基本知识介绍 ## DeepSeek：颠覆出圈，霸榜热议 DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 DeepSeek-R1是其最新发布并开源的推理模型，擅长处理复杂任务且可免费商用，其性能在多个基准测试中表现出色，对齐OpenAI-O1正式版，甚至在某些任务上表现更优。 ## 我是 DeepSeek，很高兴见到你！ at版本 2024年12月26日发布总参数达6710亿的DeepSeek-V3，采用创新MoE架构和FP8混合精度训练，训练成本大幅降低 2025年1月20日发布新一代推理模型DeepSeek-R1，性能与OpenAI的o1正式版持平，并开源 ## 推理能力：核心突破，专项升级 DeepSeek R1 的核心突破在于其通过强化学习驱动的推理能力。该模型在训练过程中，通 ## 推理能力 • 强化学习驱动：DeepSeek R1-Zero 是首个完全基于强化学习（RL）训练的推理模型，无需任何监督微调（SFT）步骤，打破传统模型依赖大量标注数据的惯例。DeepSeek-R1 采用强化学习作为核心训练方法，显著提升了模型的推理能力和语言表达的可读性。 - 推理能力专项提升：在除了利用强化学习模型结合跨领域训练提升模型综合技能以外，还重点提升了模型在数学、代码、逻辑推理等硬核任务上的能力。

0 码力 | 85 页 | 8.31 MB | 1 年前
3
DeepSeek从入门到精通(20250204)

## DeepSeek是什么？ - DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩推理大模型：推理大模型是指能够在传统的大语言模型基础上，强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术，比如强化学习、神经符号推理、元学习等，来增强其推理和问题解决能力。例如：DeepSeek-R1，GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。非推理大模型：适用于大多数任务，非推理大模型一般侧重于语言生成、上下文理解和自然语言处理，而不强调深度推理能力。此类模型通常

0 码力 | 104 页 | 5.37 MB | 1 年前
3
清华大学 DeepSeek 从入门到精通

## DeepSeek是什么？ - DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩推理大模型：推理大模型是指能够在传统的大语言模型基础上，强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术，比如强化学习、神经符号推理、元学习等，来增强其推理和问题解决能力。例如：DeepSeek-R1，GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。非推理大模型：适用于大多数任务，非推理大模型一般侧重于语言生成、上下文理解和自然语言处理，而不强调深度推理能力。此类模型通常

0 码力 | 103 页 | 5.40 MB | 1 年前
3
The AI Developer Ecosystem Report - Zhihu×ModelScope

articles, and construct their own knowledge framework. What interesting things have you built with DeepSeek-R1? "Writing code or prompts"—is this a false dilemma? Share an Al-assisted development answering questions, updating columns, and building personal influence. @ConardLi: How to fine-tune DeepSeek-R1 for a specific domain slime dev @朱小霖：RL Scaling Era—what kind of RL framework is needed? Huawei

0 码力 | 49 页 | 27.18 MB | 5 月前
3
AI时代开发者白皮书 - 知乎&魔搭

，构建自己的知识体系。你用 DeepSeek-R1 做出了什么有趣的东西？「写代码还是写提示词」是伪命题吗？能不能分享一次最近提效最明显的AI协助开发？节省了多少时间？成熟期：当他们成为资深工程师或技术专家后，角色开始转变。他们不再满足于「学」，而是开始「答」和更新专栏，构建自己的个人影响力。 @ConardLi《如何把你的 DeepSeek-R1 微调为某个领域的专家？》 slime框架开发者@朱小霖《RL

0 码力 | 49 页 | 27.17 MB | 5 月前
3
清华大学普通人如何抓住DeepSeek红利

。 ## DeepSeek是什么？ • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司，主攻大模型研发与应用。 DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正式版。 - DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAI-o1正式版。

0 码力 | 65 页 | 4.47 MB | 1 年前
3

共 13 条前往

页

分类

语言

格式

DeepSeek-R1使用指南（简版）

DeepSeek图解10页PDF

Deepseek R1 本地部署完全手册

【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

DeepSeek从入门到精通(20250204)

清华大学 DeepSeek 从入门到精通

The AI Developer Ecosystem Report - Zhihu×ModelScope

AI时代开发者白皮书 - 知乎&魔搭

清华大学普通人如何抓住DeepSeek红利

搜索

分类

语言

格式