Deepseek R1 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Deepseek R1 本地部署完全手册

## 《Deepseek R1 本地部署完全手册》版权归：HomeBrew Ai Club 作者wechat：samirtan 版本：V2.0 更新日期：2025年2月8日 ## 一、简介 Deepseek R1 是支持复杂推理、多模态处理、技术文档生成的高性能通用大语言模型。本手册为技术团队提供完整的本地部署指南，涵盖硬件配置、国产芯片适配、量化方案、云端替代方案及完整671B ### 2. 算力需求分析 |模型|参数规模|计算精度|最低显存需求|最低算力需求| |---|---|---|---|---| |DeepSeek-R1 (671B)|671B|FP8|≥890GB|2\*XE9680 (16\*H20 GPU)| |DeepSeek-R1-Distill-70B|70B|BF16|≥180GB|4\*L20 或 2\*H20 GPU| ## 三、国产芯片与硬件适配方案 |企业|适配内容|性能对标（vs NVIDIA）| |---|---|---| |华为昇腾|昇腾910B原生支持R1全系列，提供端到端推理优化方案|等效A100（FP16）| |沐曦GPU|MXN系列支持70B模型BF16推理，显存利用率提升30%|等效RTX 3090| |海光DCU|适配V3/R1模型，性能对标NVIDIA A100|等效A100（BF16）| ### 2. 国产硬件推荐配置 |模型参数|推荐方案|适用场景|

0 码力 | 7 页 | 932.77 KB | 1 年前
3
DeepSeek图解10页PDF

## DeepSeek 图解 10 页 PDF 作者：郭震 2025.2.3 ## 目录 1 本地部署并运行 DeepSeek …… 2 1.1 为什么要在本地部署 DeepSeek …… 2 1.2 DeepSeek 本地部署三个步骤 …… 2 1.3 DeepSeek 本地运行使用演示 …… 4 2 DeepSeek 零基础必知 …… 5 2.1 LLM 基础概念 3 DeepSeek-R1 精华图解 …… 7 3.1 DeepSeek-R1 完整训练过程 …… 7 3.1.1 核心创新 1：含 R1-Zero 的中间推理模型 …… 8 3.1.2 核心创新 2：通用强化学习 …… 8 3.2 含 R1-Zero 的中间推理模型训练过程 …… 9 3.3 通用强化学习训练过程 …… 10 3.4 总结 DeepSeek-R1 …… …… 11 4 参考文献 …… 11 ## 1 本地部署并运行 DeepSeek ### 1.1 为什么要在本地部署 DeepSeek 在本地搭建大模型（如 DeepSeek）具有多个重要的优势，比如： 1. 保护隐私与数据安全。数据不外传：本地运行模型可以完全避免数据上传至云端，确保敏感信息不被第三方访问。 2. 可定制化与优化。支持微调（Fine-tuning）：可以根据特定业

0 码力 | 11 页 | 2.64 MB | 1 年前
3
00 Deepseek官方提示词

更多 Deepseek 和 AI 资料，欢迎关注微信公众号【星禾光年 AI】，回复【deepseek】获取 1. 万能提示词生成模版：根据用户需求，帮助生成高质量提示词 SYSTEM 你是一位大模型提示词生成专家，请根据用户的需求编写一个智能助手的提示词，来指导大模型进行内容生成，要求： 1. 以 Markdown 格式输出 2．贴合用户需求，描述智能助手的定位、能力、知识储备 3.

0 码力 | 4 页 | 7.93 KB | 1 年前
3
DeepSeek从入门到精通(20250204)

## DeepSeek：从入门到精通清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室 @新媒沈阳团队：余梦珑博士后 • Deepseek是什么？ • Deepseek能够做什么？ · 如何使用Deepseek? ## DeepSeek是什么？ - DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的 DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。 ![Image](/uploads/documents/f/3/7/0/f37064274bc52e8d62ab0d2bc829c32d/p3_1 29c32d/p3_1.jpg) AI + 国产 + 免费 + 开源 + 强大 ## Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。 ![Image](/uploads/documents/f/3/7/0/f3

0 码力 | 104 页 | 5.37 MB | 1 年前
3
清华大学 DeepSeek 从入门到精通

## DeepSeek：从入门到精通 1.0版，0.9修订号 ## 清华大学新闻学院人工智能学院 @新媒沈阳团队、余梦珑博士后 2025年2月 • Deepseek是什么？ • Deepseek能够做什么？ · 如何使用Deepseek? ## DeepSeek是什么？ - DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSe DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。 ![Image](/uploads/documents/5/1/3/f/513f8baf8f2fc554 7b0250d9608bf2de/p3_1.jpg) AI + 国产 + 免费 + 开源 + 强大 ## Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。 ![Image](/uploads/documents/

0 码力 | 103 页 | 5.40 MB | 1 年前
3
DeepSeek-R1使用指南（简版）

aee11cff0a/p1_2.jpg) ## DeepSeek案例介绍大家好，欢迎来到 AI 使用技巧课堂！相信大家这两天已经被deepseek炸屏了。 ![Image](/uploads/documents/3/7/6/6/3766836df8de3b2fbad88caee11cff0a/p1_3.jpg) DeepSeek-R1 凭借着强大的性能和优秀的表现，在各大评测榜单中名列前茅，吸引了众多很多小伙伴可能跃跃欲试，却苦于不知如何下手。别担心，这篇教程将手把手教你如何使用DeepSeek-R1，主要介绍网页端和 API 两种方式，让你轻松玩转这款强大的 AI 模型！ ## DeepSeek-R1 有什么厉害之处？在正式开始之前，我们先来简单了解一下DeepSeek R1的亮点：不了解了，直接说最值得说的： DeepSeek-R1 通过使用多阶段循环的训练方式：基础→RL→微调→RL→微调→RL，极大加强了大模型的深度思考能力。网页端：无需代码，即点即用！对于大多数用户来说，网页端是最方便快捷的使用方式。你无需任何编程基础，只需打开浏览器，就可以与 DeepSeek-R1 进行互动。 ## 如何使用？ 1. 访问 DeepSeek 官方网站：打开 http://chat.deepseek.com/，然后注册登录，手机号或者微信扫码。 ![Image](/uploads/documents/3/7/6/6/3766

0 码力 | 25 页 | 5.57 MB | 1 年前
3
清华大学普通人如何抓住DeepSeek红利

## 普通人如何抓住DeepSeek红利清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室 @新媒沈阳团队：陶炜博士生 ## 50 ° Deepseek是什么? ☐ Deepseek能够做什么？ ——在工作、学习、生活和社会关系中解决问题 ☐ 如何提问？让AI一次性生成你想要的东西卷不动了？DeepSeek帮你一键“躺赢”！学习太难？DeepSeek带你“开挂”逆袭！生活太累？DeepSeek帮你“减负”到家！社交障碍？DeepSeek教你“高情商”破局！ ## 善用DeepSeek的两大关键：提出问题鉴别答案 ## ☐ 提示词驱动的新生产力在AI时代，知识的获取成本趋近于零，拥有知识不再是核心竞争力。利用提示词创造知识，引领创新、明确方向，成为社会与个人竞争力的关键。 ## ☐ 选择中的再创造面对AI提供的多种解法，人类需具备批判性思维 AI辅助的时代，通过决策行为实现价值创造，成为社会发展的持续动力。 ## DeepSeek是什么？ • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司，主攻大模型研发与应用。 DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正式版。 - DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极

0 码力 | 65 页 | 4.47 MB | 1 年前
3
清华大学第二弹：DeepSeek赋能职场

## DeepSeek如何赋能职场应用？ ## ——从提示语技巧到多场景应用中央民族大学新闻与传播学院清华大学 @新媒沈阳团队向安玲 ## 人机协同与共生驾驭AI实现新式智能 Sam Altman: AI发展的五个级别 Reasoner Agent Organization - 基本的推理和问题解决能力 Chatbot ·代表用户执行任务，具备自主行动能力 Innovator 新闻多模态检测| ||中国法研杯CAIL2020司法人工智能赛| ## DeepSeek的三种模式 ## 我是DeepSeek 很高兴见到你！ |平台|地址|版本|备注| |---|---|---|---| |英伟达NIM微服务|https://build.nvidia.com/deepseek-ai/deepseek-r1|671B（全量模型）|网页版直接使用，支持API调用，注册送1000点数，免费体验。| com/cn/blogs/aws/deepseek-r1-models-now-available-on-aws|671B（全量模型）|需注册AWS账户，填写付款方式，免费部署。| |Cerebras|https://cerebras.ai|70B|邮箱注册，速度快，宣称比GPU方案快57倍。| |Groq|https://groq.com/groqcloud-makes-deepseek-r1-distill

0 码力 | 35 页 | 9.78 MB | 1 年前
3
DeepSeek-V4: Towards Highly Efficient Million-Token Context Intelligence

DeepSeek-V4: Towards Highly Efficient Million-Token Context Intelligence DeepSeek-AI research@deepseek.com Abstract We present a preview version of DeepSeek-V4 series, including two strong Mixture-of- language models DeepSeek-V4-Pro with 1.6T parameters (49B activated) and DeepSeek-V4-Flash with 284B parameters (13B activated) both supporting a context length of one million tokens. DeepSeek-V4 series incorporate capabilities. DeepSeek-V4-Pro Max, the maximum reasoning effort mode of DeepSeek-V4-Pro, redefines the state-of-the-art for open models, outperforming its predecessors in core tasks. Meanwhile, DeepSeek-V4 series

0 码力 | 58 页 | 4.27 MB | 3 月前
3
DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model

# DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model DeepSeek-AI research@deepseek.com ## Abstract We present DeepSeek-V2, a strong Mixture-of-Experts (MoE) language parameters, of which 21B are activated for each token, and supports a context length of 128K tokens. DeepSeek-V2 adopts innovative architectures including Multi-head Latent Attention (MLA) and DeepSeekMoE. enables training strong models at an economical cost through sparse computation. Compared with DeepSeek 67B, DeepSeek-V2 achieves significantly stronger performance, and meanwhile saves 42.5% of training costs

0 码力 | 52 页 | 1.23 MB | 2 年前
3

共 515 条前往

页

搜索

分类

语言

格式