混合部署 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

亿联TVM部署

0 码力 | 6 页 | 1.96 MB | 6 月前
3
Deepseek R1 本地部署完全手册

《Deepseek R1 本地部署完全⼿册》版权归：HomeBrew Ai Club 作者wechat：samirtan 版本：V2.0 更新⽇期：2025年2⽉8⽇⼀、简介 Deepseek R1 是⽀持复杂推理、多模态处理、技术⽂档⽣成的⾼性能通⽤⼤语⾔模型。本⼿册为技术团队提供完整的本地部署指南，涵盖硬件配置、国产芯⽚适配、量化⽅案、云端替代⽅端替代⽅案及完整671B MoE模型的Ollama部署⽅法。核⼼提示：个⼈⽤户：不建议部署32B及以上模型，硬件成本极⾼且运维复杂。企业⽤户：需专业团队⽀持，部署前需评估ROI（投资回报率）。⼆、本地部署核⼼配置要求 1. 模型参数与硬件对应表模型参数 Windows 配置要求 Mac 配置要求适⽤场景 1.5B - RAM: 4GB - GPU: 集成显卡/现代CPU 24GB - GPU: RTX 3090（24GB VRAM） - 存储: 20GB - 内存: 32GB（M3 Max） - 存储: 20GB 复杂推理、技术⽂档⽣成 32B+ 企业级部署（需多卡并联）暂不⽀持科研计算、⼤规模数据处理 2. 算⼒需求分析模型参数规模计算精度最低显存需求最低算⼒需求 DeepSeek-R1 (671B) 671B

0 码力 | 7 页 | 932.77 KB | 8 月前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

 语言支持：支持英文和中文内容生成。知网研学平台  界面友好：操作界面简洁明了，用户容易上手，非技术背景用户也能快速学会使用该工具进行文献综述的生成。  灵活定制：支持使用本地部署的语言模型，为有特定需求的用户提供了更多灵活性。  实时演示：提供实时演示demo，方便用户了解和体验工具的功能。  语言支持：仅支持英文输入和英文内容生成。斯坦福STORM 生成综述对比：多维度对比月 2 0 日 2 0 2 4 年 1 2 月 2 6 日发布总参数达 6 7 1 0 亿的 D e e p S e e k - V 3 ，采用创新 MoE架构和FP8混合精度训练，训练成本大幅降低 DeepSeek是一家专注通用人工智能（AGl）的中国科技公司，主攻大模型研发与应用。 DeepSeek-R1是其最新发布并开源的推理模型，擅长处理复杂任务且可免费商用，其性能的表现。第二阶段：拒绝采样与监督微调通过拒绝采样从 R L 检查点生成新的合成数据，并与写作、事实问答等领域的监督数据混合。然后对基础模型进行两轮微调，进一步提升模型的性能。第三阶段：全场景强化学习结合规则奖励（针对推理任务）和神经奖

0 码力 | 85 页 | 8.31 MB | 8 月前
3
国家人工智能产业综合标准化体系建设指南（2024版）

1 国家人工智能产业综合标准化体系建设指南（2024版）为深入贯彻落实党中央、国务院关于加快发展人工智能的部署要求，贯彻落实《国家标准化发展纲要》《全球人工智能治理倡议》，进一步加强人工智能标准化工作系统谋划，加快构建满足人工智能产业高质量发展和“人工智能+”高水平赋能需求的标准体系，夯实标准对推动技术进步、促进企业发展、引领产业升级、保障产业安全的支撑作用，更好推特点，亟需完善人工智能产业标准体系。二、总体要求以习近平新时代中国特色社会主义思想为指导，全面贯彻党的二十大和二十届二中全会精神，认真落实中央经济工作会议和全国新型工业化推进大会部署要求，完整、准确、全面贯彻新发展理念，统筹高质量发展和高水平安全，加快赋能新型工业化，以抢抓人工智能产业发展先机为目标，完善人工智能标准工作顶层设计，强化全产业链标准工作协同，统筹推所示。其中，基础共性标准是人工智能的基础性、框架性、总体性标准。基础支撑标准主要规范数据、算力、算法等技术要求，为人工智能产业发展夯实技术底座。关键技术标准主要规范人工智能文本、语音、图像，以及人机混合增强智能、智能体、跨媒体智能、具身智能等的技术要求，推动人工智能技术创新和应用。智能产品与服务标准主要规范由人工智能技术形成的智能产品和服务模式。赋能新型工业化标准主要规范人工智能技术赋能

0 码力 | 13 页 | 701.84 KB | 1 年前
3
DeepSeek图解10页PDF

PDF 作者：郭震 2025.2.3 目录 1 本地部署并运行 DeepSeek . . . . . . . . . . . . . . . . . . . . . . 2 1.1 为什么要在本地部署 DeepSeek . . . . . . . . . . . . . . . . . 2 1.2 DeepSeek 本地部署三个步骤 . . . . . . . . . . . . . 11 4 参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1 1 本地部署并运行 DeepSeek 1.1 为什么要在本地部署 DeepSeek 在本地搭建大模型（如 DeepSeek）具有多个重要的优势，比如： 1. 保护隐私与数据安全。数据不外传：本地运行模型可以完全避免数据上传至云端，确保敏感信息不被第三方访问。 R1，开源免费，性能强劲 • 本教程搭建方法零成本，不需花一分钱。 • 为了照顾到大部分读者，推荐的搭建方法已将电脑配置要求降到最低，普通电脑也能飞速运行。 1.2 DeepSeek 本地部署三个步骤一共只需要三步，就能做到 DeepSeek 在本地运行并与它对话。第一步，使用的是 ollama 管理各种不同大模型，ollama 比较直接、干净，一键下载后安装就行，安装过程基本都是下一步。

0 码力 | 11 页 | 2.64 MB | 8 月前
3
人工智能安全治理框架 1.0

4 安全开发应用指引方面。明确模型算法研发者、服务提供者、重点领域用户和社会公众用户，开发应用人工智能技术的若干安全指导规范。 3. 人工智能安全风险分类人工智能系统设计、研发、训练、测试、部署、使用、维护等生命周期各环节都面临安全风险，既面临自身技术缺陷、不足带来的风险，也面临不当使用、滥用甚至恶意利用带来的安全风险。 3.1 人工智能内生安全风险 3.1.1 模型算法安全风险（a）不断提高人工智能可解释性、可预测性，为人工智能系统内部构造、- 8 - 人工智能安全治理框架推理逻辑、技术接口、输出结果提供明确说明，正确反映人工智能系统产生结果的过程。（b）在设计、研发、部署、维护过程中建立并实施安全开发规范，尽可能消除模型算法存在的安全缺陷、歧视性倾向，提高鲁棒性。 4.1.2 数据安全风险应对（a）在训练数据和用户交互数据的收集、存储、使用、加工、传输、提途管理，对特定人群及场景下使用人工智能技术提出相关要求，防止人工智能系统被滥用。对算力、推理能力达到一定阈值或应用在特定行业领域的人工智能系统进行登记备案，要求其具备在设计、研发、测试、部署、使用、维护等全生命周期的安全防护能力。 5.2 建立人工智能服务可追溯管理制度。对面向公众服务的人工智能系统，通过数字证书技术对其进行标识管理。制定出台人工智能生成合成内容标识标准规

0 码力 | 20 页 | 3.79 MB | 1 月前
3
DeepSeek从入门到精通(20250204)

描述问题背景与目标，由模型规划解决路径复杂问题、需模型自主推理 “我需要优化用户登录流程，请分析当前瓶颈并提出3种方案。” ✅ 激发模型深层推理 ❌ 需清晰定义需求边界混合模式结合需求描述与关键约束条件平衡灵活性与可控性 “设计一个杭州三日游计划，要求包含西湖和灵隐寺，且预算控制在2000元内。” ✅ 兼顾目标与细节 ❌ 需避免过度约束启发式提问 Combine（组合）：整合多个想法 • Unify（统一）：创建一致的叙述或解决方案 • Synthesize（综合）：形成最终结论跨界思维的提示语链设计基于“BRIDGE”框架 • Blend（混合）：融合不同领域的概念 • Reframe（重构）：用新视角看待问题 • Interconnect（互联）：建立领域间的联系 • Decontextualize（去情境化）：将概念从原始环境中抽离

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

描述问题背景与目标，由模型规划解决路径复杂问题、需模型自主推理 “我需要优化用户登录流程，请分析当前瓶颈并提出3种方案。” ✅ 激发模型深层推理 ❌ 需清晰定义需求边界混合模式结合需求描述与关键约束条件平衡灵活性与可控性 “设计一个杭州三日游计划，要求包含西湖和灵隐寺，且预算控制在2000元内。” ✅ 兼顾目标与细节 ❌ 需避免过度约束启发式提问 Combine（组合）：整合多个想法 • Unify（统一）：创建一致的叙述或解决方案 • Synthesize（综合）：形成最终结论跨界思维的提示语链设计基于“BRIDGE”框架 • Blend（混合）：融合不同领域的概念 • Reframe（重构）：用新视角看待问题 • Interconnect（互联）：建立领域间的联系 • Decontextualize（去情境化）：将概念从原始环境中抽离

0 码力 | 103 页 | 5.40 MB | 9 月前
3
清华大学普通人如何抓住DeepSeek红利

描述问题背景与目标，由模型规划解决路径复杂问题、需模型自主推理 “我需要优化用户登录流程，请分析当前瓶颈并提出3种方案。 ” 激发模型深层推理需清晰定义需求边界混合模式结合需求描述与关键约束条件平衡灵活性与可控性 “设计一个杭州三日游计划，要求包含西湖和灵隐寺，且预算控制在2000元内。 ” 兼顾目标与细节需避免过度约束

0 码力 | 65 页 | 4.47 MB | 8 月前
3
普通人学AI指南

. . . . . . . 13 2.6.4 Llama3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3 零代码本地部署 AI 后端 13 3.1 大模型 Llama3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3.1.1 步骤 1：安装 Ollama . . . . . 21 4.3 步骤二 docker 部署 lobechat . . . . . . . . . . . . . . . . . . . . . 22 4.4 愉快使用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 4.5 部署常见问题 . . . . . . . . . . . . . Figure 6: AI 编程工具 2.4.3 AirOps 用于生成和修改 SQL 语句的工具，旨在简化数据库操作。 2.4.4 ChatDev 面壁智能开发的 AI 智能体开发平台，支持创建和部署智能对话系统。 2.4.5 solo Mozilla 开源项目，提供零代码网站开发功能，易于使用。 2.4.6 Cursor 开源的 AI 代码编辑器，旨在通过 AI 技术助力快速软件开发。

0 码力 | 42 页 | 8.39 MB | 8 月前
3

共 14 条前往

页

分类

语言

格式