Deepseek R1 本地部署完全手册## 《Deepseek R1 本地部署完全手册》 版权归:HomeBrew Ai Club 作者wechat:samirtan 版本:V2.0 更新日期:2025年2月8日 ## 一、 简介 Deepseek R1 是支持复杂推理、多模态处理、技术文档生成的高性能通用大语言模型。本手册为技术团队提供完整的本地部署指南,涵盖硬件配置、国产芯片适配、量化方案、云端替代方案及完整671B MoE模型的Ollama部署方法。 核心提示: • 个人用户:不建议部署32B及以上模型,硬件成本极高且运维复杂。 • 企业用户:需专业团队支持,部署前需评估ROI(投资回报率)。 ## 二、 本地部署核心配置要求 ### 1. 模型参数与硬件对应表 |模型参数|Windows 配置要求|Mac 配置要求|适用场景| |---|---|---|---| |1.5B|\- RAM: 4GB- |海光DCU|适配V3/R1模型,性能对标NVIDIA A100|等效A100(BF16)| ### 2. 国产硬件推荐配置 |模型参数|推荐方案|适用场景| |---|---|---| |1.5B|太初T100加速卡|个人开发者原型验证| |14B|昆仑芯K200集群|企业级复杂任务推理| |32B|壁彻算力平台+昇腾910B集群|科研计算与多模态处理| ## 四、 云端部署替代方案 ### 1. 国内云服务商推荐0 码力 | 7 页 | 932.77 KB | 1 年前3
Gemma 4 完全指南 - 从入门到本地部署Gemma 4完全指南 从入门到本地部署 The Complete Guide to Gemma 4: From Understanding to Local Deployment 涵盖型号:E2B·E4B·26B-A4B·31B 架构:Dense+MoE·多模态·256K上下文 许可证:Apache2.0 信息来源:Google官方文档·Hugging Face·本地实测 文档版本:v1.0.0 本手册基于Google官方博客、Model Card、Hugging Face发布文档及本地实测编写。所有技术细节以2026年4月最新资料为准。AI工具迭代极快,请结合官方文档验证。 目录 CONTENTS Part 1: 认识Gemma §01 从Gemma 1到Gemma 4:Google开源模型的进化 §02 Gemma 4全家福:四个尺寸怎么选 Part 2: 本地部署实战 §03 你的电脑能不能跑 §04 Ollama部署实战 需要的能力:你可以给它看截图、读文档、处理长文本。 不过在中文圈,Gemma3的存在感依然有限。同期的Qwen2.5已经在中文任务上建立了很强的用户心智, DeepSeek也在快速崛起。大部分中文开发者的态度是:Gemma不错,但我的场景里,国产模型更顺手。 2025年6月:Gemma3n,端侧的新思路 2025年6月26日,Gemma3n作为一个特殊分支出现,提供E2B和E4B两个型号。 这里0 码力 | 42 页 | 4.85 MB | 1 月前3
CurveFS S3本地缓存盘方案Curvefs-S3 本地写缓存盘方案 背景 方案设计 主要数据结构定义 方案设计思考 POC验证 ## 背景 当前,s3客户端在写底层存储的时候是直接写入远端对象存储,由于写远端时延相对会较高,所以为了提升性能,引入了写本地缓存盘方案。也即要写底层存储时,先把数据写到本地缓存硬盘,然后再把本地缓存硬盘中的数据异步上传到远端对象存储。 ## 方案设计 ![Image] S3模块接收到写入后先写入写内存缓存页,如果满足持久化的条件后,那么则准备持久化。 做一个硬链接链接到该文件。 本次io在本地硬盘写入好之后,异步上传模块会适时把本地硬盘写缓存目录中的文件上传到远端对象存储集群,上传成功后,删除本地写缓存目录中的对应文件。 同时,缓存清理模块会定时检查本地硬盘缓存目录容量情况,如果容量已经达到阈值了,则进行文件的清理工作。 另外,异常管理模块处理客户端挂掉后的文件重新上传问题。 std::string CacheReadDir_; ## 方案设计思考 本地硬盘如何管理 借用linux本地文件系统进行管理,存储进本地硬盘的内容以文件的形式来表现。 配置一个目录用于本地硬盘的文件管理,对作为缓存盘的本地硬盘进行格式化并挂载到该目录(如果没有缓存盘,那一般而言就是系统盘本身了)。 • 本地缓存盘的文件内容表示 本地缓存盘存放的文件即是存储到对象存储中的对象。 • 写缓存如何作为读缓存利用0 码力 | 9 页 | 150.46 KB | 1 年前3
Java 应用与开发 - Java 技术概述及开发环境# Java 应用与开发 Java 技术概述及开发环境 王晓东 wangxiaodong@ouc.edu.cn 中国海洋大学 September 18, 2018  。 ## 接下来… Java 技术概述 Java 平台核心机制 Java 开发环境 Java 基本开发流程 ## Java 平台 Java应用程序 Java API 开发 LiveScript 1.0,与 Sun 公司组成开发联盟。由于 Java 正流行,LiveScript 发布前临时改名 JavaScript. ➢1996: Microsoft 采用 ➢在 Internet Explorer 准化一种通用、跨平台、供应商中立的脚本语言的语法和语义”。 定义一种名为 ECMAScript 的新脚本语言标准。 ➢1998: ISO/IEC 采用 ECMAScript 作为标准 ➢浏览器开发商开始致力于将 ECMAScript 作为各自 JavaScript 实现基础。 ### 2. JavaScript 和脚本语言 ## JavaScript ➢一种高级的,面向对象的脚本语言。0 码力 | 21 页 | 1.02 MB | 2 年前3
Hadoop开发指南## Hadoop开发指南 注解:本例中所运行脚本需在CentOS操作系统上,其他操作系统请修改脚本后再尝试执行。 ### 1. 在UHost上安装Hadoop客户端 出于安全性考虑,一般建议用户在非UHadoop集群机器上安装客户端进行任务提交与相关操作 ### 1.1 控制台安装 可通过控制台一键安装,参考:客户端安装。 ### 1.2 自行安装 针对部分存量已自行安装用户,可根据选择按照以下方式自行安装。0 码力 | 12 页 | 135.94 KB | 2 年前3
PostgreSQL 开发最佳实践# PostgreSQL 开发最佳实践 p0s digoal 阿里云 ## 目录 - 规约的重要性 - 命名规约 - 设计规约 - 管理规约 - 稳定性与性能建议 - 云数据库使用建议 ## 规约的重要性  ## 目录 explain analyze query; rollback; • create index CONCURRENTLY idx on tbl(id); - 密码复杂度、认证方法 - 业务系统,开发测试账号,不要使用数据库超级用户。 • 长连接re\-lcache, sycache • 数据隔离(cluster -> database -> schema) • 主备切换(prewarm)0 码力 | 16 页 | 381.36 KB | 2 年前3
ubunutu 怎么参与内核开发## 怎么参与内核开发 Eric Miao 大家交流下我的经验,主要是相互学习: 我先介绍下我的经验吧。原来我是做嵌入式开发的,主要是在 Intel/Marvell 做 PXA/Xscale 这一块的,广  泛用在 PDA 上。也许大家见过过气的 等系列的手机,就是用的这款 CPU。 开发过程中发现总是跟随着 Kernel 升级,开发工作很被动。内核树 Kernel 升级到 2.6.14 了,而我们却还在搞 2.6.9。那会儿我们还跟 MontaVista 有合作,所以曾经还搞过 2.4 的内核。PXA27x 上就有些客户在用 2.4,很是崩溃…… 后来我跟 boss 反应,这么开发是不行的,要把我们做的东西推到 mainline 里面去。那时开发组的反应有两种: kernel …… 唉,那都是很牛 B 的代码,很牛 B 的人在搞。(其实现在想想也不都是牛人,我这样的庸枝俗粉一堆); 2. 搞 mainline kernel 很非主流,伺候好客户就行了。 所以一开始的开发我很寂寞的,不过好在老板非常支持,有了加薪的动力,做事情就卖力了。最初的确很难,对于 ARM 社区情况不熟,发点 patch 就被弹回,大致理由有如下: 1. 你回去仔细看下 Documentation/CodingStyle;0 码力 | 3 页 | 271.06 KB | 1 年前3
前端开发者指南(2017)1.1 前端开发者是什么?1.2 2016前端开发回顾1.3 展望20171.4 第一部分.前端实践1.5 前端职称1.5.1 前端开发者所使用的技术1.5.2 前端开发技能1.5.3 前端开发者为...而开发1.5.4 团队里的前端1.5.5 全能型人才/全栈神话1.5.6 前端面试1.5.7 前端开发职位公示1.5.8 前端开发薪资1.5.9 前端开发者是如何诞生的1.5.10 第二部分:学习前端开发1.6 自学1.6.1 关于互联网/WEB1.6.1.1 学习Web浏览器1.6.1.2 学习域名系统(又叫DNS)1.6.1.3 学习HTTP/Networks(包括CORS和WebSockets)1.6.1.4 学习网页寄存(通称虚拟主机)1.6.1.5 学习前端开发1.6.1.6 学习用户界面/交互设计1 1.21 学习 React & Redux 1.6.1.22 学习渐进式 Web 应用 1.6.1.23 学习设计 JS API 1.6.1.24 学习web开发工具 1.6.1.25 学习命令行的使用 1.6.1.26 学习 Node.js 1.6.1.27 学习 JS 模块系统 1.6.1.28 学习模块加载和打包工具 10 码力 | 164 页 | 6.43 MB | 2 年前3
Java 应用与开发 - Servlet 编程## Java 应用与开发 Servlet 编程 王晓东 wangxiaodong@ouc.edu.cn 计算机科学与技术系 November 13, 2018  












