亿联TVM部署0 码力 | 6 页 | 1.96 MB | 6 月前3
Deepseek R1 本地部署完全手册《Deepseek R1 本地部署完全⼿册》 版权归:HomeBrew Ai Club 作者wechat:samirtan 版本:V2.0 更新⽇期:2025年2⽉8⽇ ⼀、简介 Deepseek R1 是⽀持复杂推理、多模态处理、技术⽂档⽣成的⾼性能通⽤⼤语⾔模型。本⼿册 为技术团队提供完整的本地部署指南,涵盖硬件配置、国产芯⽚适配、量化⽅案、云端替代⽅ 端替代⽅ 案及完整671B MoE模型的Ollama部署⽅法。 核⼼提示: 个⼈⽤户:不建议部署32B及以上模型,硬件成本极⾼且运维复杂。 企业⽤户:需专业团队⽀持,部署前需评估ROI(投资回报率)。 ⼆、本地部署核⼼配置要求 1. 模型参数与硬件对应表 模型参 数 Windows 配置要求 Mac 配置要求 适⽤场景 1.5B - RAM: 4GB - GPU: 集成显卡/现代CPU 24GB - GPU: RTX 3090(24GB VRAM) - 存储: 20GB - 内存: 32GB(M3 Max) - 存储: 20GB 复杂推理、技术⽂档⽣ 成 32B+ 企业级部署(需多卡并联) 暂不⽀持 科研计算、⼤规模数据 处理 2. 算⼒需求分析 模型 参数规 模 计算精 度 最低显存需 求 最低算⼒需求 DeepSeek-R1 (671B) 671B0 码力 | 7 页 | 932.77 KB | 8 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单 语言支持:支持英文和中文内容 生成。 知网研学平台 界面友好:操作界面简洁明了,用户容易上 手,非技术背景用户也能快速学会使用该工 具进行文献综述的生成。 灵活定制:支持使用本地部署的语言模型, 为有特定需求的用户提供了更多灵活性。 实时演示:提供实时演示demo,方便用户了 解和体验工具的功能。 语言支持:仅支持英文输入和英文内容生成。 斯坦福STORM 生成综述对比:多维度对比 月 2 0 日 2 0 2 4 年 1 2 月 2 6 日 发 布 总 参 数 达 6 7 1 0 亿 的 D e e p S e e k - V 3 , 采 用 创 新 MoE架构和FP8混合精度训练, 训练成本大幅降低 DeepSeek是一家专注通用人工智能(AGl)的中国科技公司,主攻大模型研发与应用。 DeepSeek-R1是其最新发布并开源的推理模型,擅长处理复杂任务且可免费商用,其性能 的表现。 第二阶段:拒绝 采样与监督微调 通 过 拒 绝 采 样 从 R L 检 查 点 生 成 新 的 合 成 数 据 , 并 与 写 作 、 事 实 问 答 等 领 域的监督数据混合。 然 后 对 基 础 模 型 进 行 两 轮 微 调 , 进 一 步提升模型的性能。 第三阶段:全场 景强化学习 结 合 规 则 奖 励 ( 针 对 推 理 任 务 ) 和 神 经 奖0 码力 | 85 页 | 8.31 MB | 8 月前3
国家人工智能产业综合标准化体系建设指南(2024版)1 国家人工智能产业综合标准化体系建设指南 (2024版) 为深入贯彻落实党中央、国务院关于加快发展人工智能 的部署要求,贯彻落实《国家标准化发展纲要》《全球人工 智能治理倡议》,进一步加强人工智能标准化工作系统谋划, 加快构建满足人工智能产业高质量发展和“人工智能+”高水 平赋能需求的标准体系,夯实标准对推动技术进步、促进企 业发展、引领产业升级、保障产业安全的支撑作用,更好推 特点,亟需 完善人工智能产业标准体系。 二、总体要求 以习近平新时代中国特色社会主义思想为指导,全面贯 彻党的二十大和二十届二中全会精神,认真落实中央经济工 作会议和全国新型工业化推进大会部署要求,完整、准确、 全面贯彻新发展理念,统筹高质量发展和高水平安全,加快 赋能新型工业化,以抢抓人工智能产业发展先机为目标,完 善人工智能标准工作顶层设计,强化全产业链标准工作协 同,统筹推 所示。其中,基础共性标准是人 工智能的基础性、框架性、总体性标准。基础支撑标准主要 规范数据、算力、算法等技术要求,为人工智能产业发展夯 实技术底座。关键技术标准主要规范人工智能文本、语音、 图像,以及人机混合增强智能、智能体、跨媒体智能、具身 智能等的技术要求,推动人工智能技术创新和应用。智能产 品与服务标准主要规范由人工智能技术形成的智能产品和 服务模式。赋能新型工业化标准主要规范人工智能技术赋能0 码力 | 13 页 | 701.84 KB | 1 年前3
DeepSeek图解10页PDFPDF 作者:郭震 2025.2.3 目录 1 本地部署并运行 DeepSeek . . . . . . . . . . . . . . . . . . . . . . 2 1.1 为什么要在本地部署 DeepSeek . . . . . . . . . . . . . . . . . 2 1.2 DeepSeek 本地部署三个步骤 . . . . . . . . . . . . . 11 4 参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1 1 本地部署并运行 DeepSeek 1.1 为什么要在本地部署 DeepSeek 在本地搭建大模型(如 DeepSeek)具有多个重要的优势,比如: 1. 保护隐私与数据安全。数据不外传:本地运行模型可以完全避免数据上 传至云端,确保敏感信息不被第三方访问。 R1,开源免费,性能强劲 • 本教程搭建方法 零成本,不需花一分钱。 • 为了照顾到大部分读者,推荐的搭建方法已将电脑配置要求降 到最低,普通电脑也能飞速运行。 1.2 DeepSeek 本地部署三个步骤 一共只需要三步,就能做到 DeepSeek 在本地运行并与它对话。 第一步,使用的是 ollama 管理各种不同大模型,ollama 比较直接、干净, 一键下载后安装就行,安装过程基本都是下一步。0 码力 | 11 页 | 2.64 MB | 8 月前3
人工智能安全治理框架 1.04 安全开发应用指引方面。明确模型算法研发者、服务提供者、重点 领域用户和社会公众用户,开发应用人工智能技术的若干安全指导规范。 3. 人工智能安全风险分类 人工智能系统设计、研发、训练、测试、部署、使用、维护等生命周期 各环节都面临安全风险,既面临自身技术缺陷、不足带来的风险,也面临不当 使用、滥用甚至恶意利用带来的安全风险。 3.1 人工智能内生安全风险 3.1.1 模型算法安全风险 (a)不断提高人工智能可解释性、可预测性,为人工智能系统内部构造、- 8 - 人工智能安全治理框架 推理逻辑、技术接口、输出结果提供明确说明,正确反映人工智能系统产生结 果的过程。 (b)在设计、研发、部署、维护过程中建立并实施安全开发规范,尽可 能消除模型算法存在的安全缺陷、歧视性倾向,提高鲁棒性。 4.1.2 数据安全风险应对 (a) 在训练数据和用户交互数据的收集、存储、使用、加工、传输、提 途管理,对特定人群及场景下使用人工智能技术提出相关要求,防止人工智能 系统被滥用。对算力、推理能力达到一定阈值或应用在特定行业领域的人工智 能系统进行登记备案,要求其具备在设计、研发、测试、部署、使用、维护等 全生命周期的安全防护能力。 5.2 建立人工智能服务可追溯管理制度。对面向公众服务的人工智能 系统,通过数字证书技术对其进行标识管理。制定出台人工智能生成合成内容 标识标准规0 码力 | 20 页 | 3.79 MB | 1 月前3
DeepSeek从入门到精通(20250204)描述问题背景与目标, 由模型规划解决路径 复杂问题、需模型自主 推理 “我需要优化用户登录流程, 请分析当前瓶颈并提出3种方 案。” ✅ 激发模型深层推理 ❌ 需清晰定义需求边界 混合模式 结合需求描述与关键 约束条件 平衡灵活性与可控性 “设计一个杭州三日游计划, 要求包含西湖和灵隐寺,且 预算控制在2000元内。” ✅ 兼顾目标与细节 ❌ 需避免过度约束 启发式提问 Combine(组合):整合多个想法 • Unify(统一):创建一致的叙述或解决方案 • Synthesize(综合):形成最终结论 跨界思维的提示语链设计 基于“BRIDGE”框架 • Blend(混合):融合不同领域的概念 • Reframe(重构):用新视角看待问题 • Interconnect(互联):建立领域间的联系 • Decontextualize(去情境化):将概念从原始环 境中抽离0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通描述问题背景与目标, 由模型规划解决路径 复杂问题、需模型自主 推理 “我需要优化用户登录流程, 请分析当前瓶颈并提出3种方 案。” ✅ 激发模型深层推理 ❌ 需清晰定义需求边界 混合模式 结合需求描述与关键 约束条件 平衡灵活性与可控性 “设计一个杭州三日游计划, 要求包含西湖和灵隐寺,且 预算控制在2000元内。” ✅ 兼顾目标与细节 ❌ 需避免过度约束 启发式提问 Combine(组合):整合多个想法 • Unify(统一):创建一致的叙述或解决方案 • Synthesize(综合):形成最终结论 跨界思维的提示语链设计 基于“BRIDGE”框架 • Blend(混合):融合不同领域的概念 • Reframe(重构):用新视角看待问题 • Interconnect(互联):建立领域间的联系 • Decontextualize(去情境化):将概念从原始环 境中抽离0 码力 | 103 页 | 5.40 MB | 9 月前3
清华大学 普通人如何抓住DeepSeek红利描述问题背景与目标, 由模型规划解决路径 复杂问题 、需模型自主 推理 “我需要优化用户登录流程, 请分析当前瓶颈并提出3种方 案 。 ” 激发模型深层推理 需清晰定义需求边界 混合模式 结合需求描述与关键 约束条件 平衡灵活性与可控性 “设计一个杭州三日游计划, 要求包含西湖和灵隐寺, 且 预算控制在2000元内 。 ” 兼顾目标与细节 需避免过度约束0 码力 | 65 页 | 4.47 MB | 8 月前3
普通人学AI指南. . . . . . . 13 2.6.4 Llama3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3 零代码本地部署 AI 后端 13 3.1 大模型 Llama3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3.1.1 步骤 1:安装 Ollama . . . . . 21 4.3 步骤二 docker 部署 lobechat . . . . . . . . . . . . . . . . . . . . . 22 4.4 愉快使用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 4.5 部署常见问题 . . . . . . . . . . . . . Figure 6: AI 编程工具 2.4.3 AirOps 用于生成和修改 SQL 语句的工具,旨在简化数据库操作。 2.4.4 ChatDev 面壁智能开发的 AI 智能体开发平台,支持创建和部署智能对话系统。 2.4.5 solo Mozilla 开源项目,提供零代码网站开发功能,易于使用。 2.4.6 Cursor 开源的 AI 代码编辑器,旨在通过 AI 技术助力快速软件开发。0 码力 | 42 页 | 8.39 MB | 8 月前3
共 14 条
- 1
- 2













