DeepSeek-R1使用指南(简版)1cff0a/p1_3.jpg) DeepSeek-R1 凭借着强大的性能和优秀的表现,在各大评测榜单中名列前茅,吸引了众多 AI 爱好者的关注。 很多小伙伴可能跃跃欲试,却苦于不知如何下手。 别担心,这篇教程将手把手教你如何使用DeepSeek-R1,主要介绍网页端和 API 两种方式,让你轻松玩转这款强大的 AI 模型! ## DeepSeek-R1 有什么厉害之处? 在正式开始之前,我们先来简单了解一下DeepSeek 在正式开始之前,我们先来简单了解一下DeepSeek R1的亮点:不了解了,直接说最值得说的: DeepSeek-R1 通过使用多阶段循环的训练方式:基础→RL→微调→RL→微调→RL,极大加强了大模型的深度思考能力。 先看看一个例子。 提问:创造一个复杂的反派角色,他的每一个恶行背后都有令人同情的理由,同时他自己认为是正义的。请为这个角色设计一个具体的背景故事和驱动力。 创造一个复杂的反派角色,他的每一 caee11cff0a/p8_2.jpg) ## 一、 网页端:无需代码,即点即用! 对于大多数用户来说,网页端是最方便快捷的使用方式。你无需任何编程基础,只需打开浏览器,就可以与 DeepSeek-R1 进行互动。 ## 如何使用? 1. 访问 DeepSeek 官方网站:打开 http://chat.deepseek.com/,然后注册登录,手机号或者微信扫码。  图 3: DeepSeek-r1 下载到本地电脑命令 教程作者:郭震,工作8 terminal(苹果电脑) 执行命令:ollama run deepseek-r1:1.5b,很快就能进入对话界面,如下图4所示:  图 4: Ollama 软件启动 deepseek-r1 界面 ### 1.3 DeepSeek 本地运行使用演示0 码力 | 11 页 | 2.64 MB | 1 年前3
Deepseek R1 本地部署完全手册(需多卡并联)|暂不支持|科研计算、大规模数据处理| ### 2. 算力需求分析 |模型|参数规模|计算精度|最低显存需求|最低算力需求| |---|---|---|---|---| |DeepSeek-R1 (671B)|671B|FP8|≥890GB|2\*XE9680 (16\*H20 GPU)| |DeepSeek-R1-Distill-70B|70B|BF16|≥180GB|4\*L20 6. 英伟达NIM: https://build.nvidia.com/deepseek-ai/deepseek-r1 7. Groq: https://groq.com/ 8. Fireworks: https://fireworks.ai/models/fireworks/deepseek-r1 9. Chutes: https://chutes.ai/app/chute/ 10. Github: Github: https://github.com/marketplace/models/azureml-deepseek/DeepSeek-R1/playground 11. POE: https://poe.com/DeepSeek-R1 12. Cursor: https://cursor.sh/ 13. Monica: https://monica.im/invitation?c=ACZ7WJJ90 码力 | 7 页 | 932.77 KB | 1 年前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502DeepSeek出现之前的十大预判之五 知识的质量和密度决定大模型能力 高质量数据、合成数据使模型知识密度的快速增长 ➢ 大模型能以更少的参数量达到更高的性能 360联合北大研发:5%参数量逼近Deepseek-R1满血性能 ## DeepSeek出现之前的十大预判 之六 成本越来越低 过去一年,大模型成本「自由落体」 国外:GPT-4等效智能在过去18个月内价格下降240倍 国内:大模型「亏本」卖,可以「白嫖」大模型API能力 市场推广创新——让过去很难得到的东西可以得到 商业模式创新——让过去很昂贵的东西变得很便宜甚至免费 DeepSeek正是符合这四种创新模式的完美例子 ## DeepSeek颠覆式创新——技术创新 DeepSeek-R1突破了大模型Scaling Law瓶颈 大数据+大参数+大算力的预训练Scaling Law的边际效应递减 • 人类构造的训练数据已达上限 - 万亿参数规模之后,继续增大参数规模难以带来质的提升 通过后训练算力和推理算力,在不增加预训练算力前提下,大幅提升模型性能 开辟强化学习新范式 从预训练Scaling Law转变为强化学习Scaling Law ## DeepSeek颠覆式创新——技术创新 DeepSeek-R1和GPT-4o不是同一个物种 预训练大模型 → 推理大模型 预训练模型如GPT——疯狂读书,积累知识,Scaling law撞墙 ➢ 预训练模型思考深度不够 算力见顶,变成少数巨头游戏0 码力 | 76 页 | 5.02 MB | 1 年前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单DeepSeek+DeepResearch 基本知识介绍 ## DeepSeek:颠覆出圈,霸榜热议 DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。 DeepSeek-R1是其最新发布并开源的推理模型,擅长处理复杂任务且可免费商用,其性能在多个基准测试中表现出色,对齐OpenAI-O1正式版,甚至在某些任务上表现更优。 ## 我是 DeepSeek,很高兴见到你! at版本 2024年12月26日 发布总参数达6710亿的DeepSeek-V3,采用创新MoE架构和FP8混合精度训练,训练成本大幅降低 2025年1月20日 发布新一代推理模型DeepSeek-R1,性能与OpenAI的o1正式版持平,并开源 ## 推理能力:核心突破,专项升级 DeepSeek R1 的核心突破在于其通过强化学习驱动的推理能力。该模型在训练过程中,通 ## 推理能力 • 强化学习驱动:DeepSeek R1-Zero 是首个完全基于强化学习(RL)训练的推理模型,无需任何监督微调(SFT)步骤,打破传统模型依赖大量标注数据的惯例。DeepSeek-R1 采用强化学习作为核心训练方法,显著提升了模型的推理能力和语言表达的可读性。 - 推理能力专项提升:在除了利用强化学习模型结合跨领域训练提升模型综合技能以外,还重点提升了模型在数学、代码、逻辑推理等硬核任务上的能力。0 码力 | 85 页 | 8.31 MB | 1 年前3
OpenClaw橙皮书-从入门到精通-v1.1.0|模型|输入/1M|输出/1M|定位| |---|---|---|---| |DeepSeek-V3.2.2(deepseek-chat)|$0.14|$0.28|当前稳定版,极致低价| |DeepSeek-R1(deepseek-reasoner)|$0.55~0.70|$2.19~2.50|深度推理| ## 配置方式(自定义Provider) ```json { env: { 最流行的本地模型运行方案,完全免费,OpenClaw能自动发现已安装的模型。 # 1. 安装Ollama后拉取模型 ollama pull qwen2.5:32b ollama pull deepseek-r1:14b # 2. 设置环境变量(任意值即可) OLLAMA_API_KEY=ollama-local # 3. OpenClaw自动发现支持工具调用的本地模型 ## 注意 不要使用/v1 5-Coder:32B|32B|代码生成、Agent任务|32GB RAM| |Devstral-24B|24B|Agent/工具调用|32GB RAM| |Qwen2.5:32B|32B|通用任务|32GB RAM| |DeepSeek-R1:14B|14B|推理任务|16GB RAM| |Llama3.3|8B-70B|通用任务|16-64GB RAM| 硬件要求速查:运行3-7B参数模型最低需要16GB RAM。运行32B参数模型推荐32GB0 码力 | 103 页 | 7.97 MB | 2 月前3
OpenClaw橙皮书:从入门到精通 - v1.4.0OpenClaw社区最常用的低成本模型。 模型 输入/1M 输出/1M 定位 DeepSeek-V3.2.2(deepseek-chat) $0.14 $0.28 当前稳定版,极致低价 DeepSeek-R1(deepseek-reasoner) $0.55~0.70 $2.19~2.50 深度推理 配置方式(自定义Provider) { env: { "DEEPSEEK_API_KEY": Ollama 最流行的本地模型运行方案,完全免费,OpenClaw能自动发现已安装的模型。 1. 安装Ollama后拉取模型 ollama pull qwen2.5:32b ollama pull deepseek-r1:14b 2. 设置环境变量(任意值即可) OLLAMA_API_KEY=ollama-local 3. OpenClaw自动发现支持工具调用的本地模型 注意 不要使用/v1 OpenAI兼 代码生成、Agent任务 32GB RAM Devstral-24B 24B Agent/工具调用 32GB RAM Qwen2.5:32B 32B 通用任务 32GB RAM DeepSeek-R1:14B 14B 推理任务 16GB RAM Llama3.3 8B-70B 通用任务 16-64GB RAM 硬件要求速查:运行3-7B参数模型最低需要16GB RAM。运行32B参数模型推荐32GB0 码力 | 114 页 | 8.90 MB | 1 月前3
DeepSeek从入门到精通(20250204)## DeepSeek是什么? - DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 推理大模型:推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。 例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。 非推理大模型:适用于大多数任务,非推理大模型一般侧重于语言生成、上下文理解和自然语言处理,而不强调深度推理能力。此类模型通常0 码力 | 104 页 | 5.37 MB | 1 年前3
清华大学 DeepSeek 从入门到精通## DeepSeek是什么? - DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 推理大模型:推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。 例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。 非推理大模型:适用于大多数任务,非推理大模型一般侧重于语言生成、上下文理解和自然语言处理,而不强调深度推理能力。此类模型通常0 码力 | 103 页 | 5.40 MB | 1 年前3
The AI Developer Ecosystem Report - Zhihu×ModelScopearticles, and construct their own knowledge framework. What interesting things have you built with DeepSeek-R1? "Writing code or prompts"—is this a false dilemma? Share an Al-assisted development answering questions, updating columns, and building personal influence. @ConardLi: How to fine-tune DeepSeek-R1 for a specific domain slime dev @朱小霖:RL Scaling Era—what kind of RL framework is needed? Huawei0 码力 | 49 页 | 27.18 MB | 3 月前3
共 15 条
- 1
- 2













