JVM 内存模型## JVM 内存模型 0 码力 | 1 页 | 48.42 KB | 2 年前3
Deepseek R1 本地部署完全手册## 《Deepseek R1 本地部署完全手册》 版权归:HomeBrew Ai Club 作者wechat:samirtan 版本:V2.0 更新日期:2025年2月8日 ## 一、 简介 Deepseek R1 是支持复杂推理、多模态处理、技术文档生成的高性能通用大语言模型。本手册为技术团队提供完整的本地部署指南,涵盖硬件配置、国产芯片适配、量化方案、云端替代方案及完整671B 整671B MoE模型的Ollama部署方法。 核心提示: • 个人用户:不建议部署32B及以上模型,硬件成本极高且运维复杂。 • 企业用户:需专业团队支持,部署前需评估ROI(投资回报率)。 ## 二、 本地部署核心配置要求 ### 1. 模型参数与硬件对应表 |模型参数|Windows 配置要求|Mac 配置要求|适用场景| |---|---|---|---| |1.5B|\- RAM: 20GB|\- 内存: 32GB (M3 Max)- 存储: 20GB|复杂推理、技术文档生成| |32B+|企业级部署 (需多卡并联)|暂不支持|科研计算、大规模数据处理| ### 2. 算力需求分析 |模型|参数规模|计算精度|最低显存需求|最低算力需求| |---|---|---|---|---| |DeepSeek-R1 (671B)|671B|FP8|≥890GB|2\*XE9680 (16\*H200 码力 | 7 页 | 932.77 KB | 1 年前3
Gemma 4 完全指南 - 从入门到本地部署Gemma 4完全指南 从入门到本地部署 The Complete Guide to Gemma 4: From Understanding to Local Deployment 涵盖型号:E2B·E4B·26B-A4B·31B 架构:Dense+MoE·多模态·256K上下文 许可证:Apache2.0 信息来源:Google官方文档·Hugging Face·本地实测 文档版本:v1.0.0 本手册基于Google官方博客、Model Card、Hugging Face发布文档及本地实测编写。所有技术细节以2026年4月最新资料为准。AI工具迭代极快,请结合官方文档验证。 目录 CONTENTS Part 1: 认识Gemma §01 从Gemma 1到Gemma 4:Google开源模型的进化 §02 Gemma 4全家福:四个尺寸怎么选 Part 2: 本地部署实战 §03 你的电脑能不能跑 §04 Ollama部署实战 Ollama部署实战 §05 LM Studio + llama.cpp部署 §06 接入OpenClaw和龙虾产品 Part 3: 用起来 §07 端侧模型的黄金场景 §08 进阶玩法与调优 §01 从Gemma 1到Gemma 4 The Gemma Timeline: From Benchmark Project to Product Line Google做开源LLM这件事,走了两年多弯路。Gemm0 码力 | 42 页 | 4.85 MB | 1 月前3
CurveFS S3本地缓存盘方案Curvefs-S3 本地写缓存盘方案 背景 方案设计 主要数据结构定义 方案设计思考 POC验证 ## 背景 当前,s3客户端在写底层存储的时候是直接写入远端对象存储,由于写远端时延相对会较高,所以为了提升性能,引入了写本地缓存盘方案。也即要写底层存储时,先把数据写到本地缓存硬盘,然后再把本地缓存硬盘中的数据异步上传到远端对象存储。 ## 方案设计 ![Image] S3模块接收到写入后先写入写内存缓存页,如果满足持久化的条件后,那么则准备持久化。 做一个硬链接链接到该文件。 本次io在本地硬盘写入好之后,异步上传模块会适时把本地硬盘写缓存目录中的文件上传到远端对象存储集群,上传成功后,删除本地写缓存目录中的对应文件。 同时,缓存清理模块会定时检查本地硬盘缓存目录容量情况,如果容量已经达到阈值了,则进行文件的清理工作。 另外,异常管理模块处理客户端挂掉后的文件重新上传问题。 std::string CacheReadDir_; ## 方案设计思考 本地硬盘如何管理 借用linux本地文件系统进行管理,存储进本地硬盘的内容以文件的形式来表现。 配置一个目录用于本地硬盘的文件管理,对作为缓存盘的本地硬盘进行格式化并挂载到该目录(如果没有缓存盘,那一般而言就是系统盘本身了)。 • 本地缓存盘的文件内容表示 本地缓存盘存放的文件即是存储到对象存储中的对象。 • 写缓存如何作为读缓存利用0 码力 | 9 页 | 150.46 KB | 1 年前3
开源中国 2023 大模型(LLM)技术报告李泽辰,Gitee 主编 李涛,APUS董事长兼CEO 2023年12月发布 设计:张琪 ## LLM 技术报告 大语言模型(LLM)技术作为人工智能领域的一项重要创新在今年引起了广泛的关注。 LLM 是利用深度学习和大数据训练的人工智能系统,专门设计来理解、生成和回应自然语言。这些模型通过分析大量的文本数据来学习语言的结构和用法,从而能够执行各种语言相关任务。以 GPT 系列为代表,LLM 以其在自 以其在自然语言处理领域的卓越表现,成为推动语言理解、生成和应用的引擎。 LLM 在多个领域都取得了令人瞩目的成就。在自然语言处理领域,GPT 系列模型在文本生成、问答系统和对话生成等任务中展现出色的性能。在知识图谱构建、智能助手开发等方面,LLM 技术也发挥了关键作用。此外,它还在代码生成、文本摘要、翻译等任务中展现了强大的通用性。 本报告从技术人视角出发,将深入探讨 LLM 技术的背景、基础设施、应用现状,以及相关的工具和平台。 ## LLM Tech Map ## 大模型 ➢ 备案上线的中国大模型 知名大模型 知名大模型应用 LLMOps 大模型聚合平台 ## 工具和平台 ➢ 开发工具 插件、IDE、终端代码生成工具 ## AI 编程 ## 算力 ## 基础设施 向量数据库 数据库向量支持 ➢ 大模型框架、微调 (Fine Tuning) ➢ 大模型训练平台与工具 ## LLM Agent0 码力 | 32 页 | 13.09 MB | 2 年前3
RustBelt - Rust 的形式化语义模型RUST CHINA CONF 2023 第三届中国 Rust 开发者大会 王俊吉 6.17-6.18 @Shanghai ## Outline ## RustBelt - Rust 的形式化语义模型 Background Rust Semantics • RustBelt Project • Type System • Rust Types Overview • The own Predict0 码力 | 21 页 | 2.63 MB | 2 年前3
领域驱动设计&中台/架构分层模型适配## 架构分层模型适配 有效防止架构腐化实践 吴雪峰@201811 DDCHINA ## CONTENTS 01 DDD分层参考架构 02 严纪律 防腐化 — 分层模型适配 03 分层模型适配实例 ## DDD分层参考架构 ## DDD分层参考架构 前端应用  给用户提供界面,关注用户交互和体验 为前端应用提供API服务,关注事务和分布式等技术性问题 领域模型和领域逻辑,关注业务概念。 访问外界系统(调用外界系统)的技术相关实现。 分层依据: 干系人和技术点 ## DDD分层参考架构 - 前端应用 前端应用 UX关注的层  ## 腐化案例: 亏空 大量技术术语业务人员完全看不懂领域模型和领域逻辑,关注业务概念。0 码力 | 39 页 | 2.54 MB | 2 年前3
AI大模型千问 qwen 中文文档AI agent, etc. 最新版本 Qwen1.5 有以下特点: • 6 种模型规模,包括 0.5B、1.8B、4B、7B、14B 和 72B; - 针对每种尺寸提供基础模型和 Chat 模型,并确保聊天模型按照人类偏好进行校准; • 对基础模型和 Chat 模型的多语言支持 - 基础模型和聊天模型都支持多种语言; - 支持工具调用、RAG(检索增强文本生成)、角色扮演、AI Agent 微信群。很期待见到你们! ## 文档 ### 1.1 安装 要快速上手 Qwen1.5,您可以从 Hugging Face 安装 transformers 库,并使用 Qwen1.5 Collection 中的模型。我们建议您安装最新版本的 transformers 库,或者至少安装 4.37.0 版本。 #### 1.1.1 Pip 安装 pip install transformers -U #### 我们建议您首先尝试使用 transformers 进行推理。请确保已安装了 transformers>=4.37.0 版本。以下是一个非常简单的代码片段示例,展示如何运行 Qwen1.5-Chat 模型,其中包含 Qwen1.5-7B-Chat 的实例: from transformers import AutoModelForCausalLM, AutoTokenizer device = "cuda"0 码力 | 56 页 | 835.78 KB | 2 年前3
机器学习课程-温州大学-11深度学习-序列模型## 深度学习-序列模型 黄海广 副教授 2023年05月 ## 本章目录 01 序列模型概述 02 循环神经网络(RNN) 03 长短期记忆(LSTM) 04 双向循环神经网络 05 深层循环神经网络 ### 1. 序列模型概述 ## 01 序列模型概述 02 循环神经网络(RNN) 03 长短期记忆(LSTM) 04 双向循环神经网络 05 深层循环神经网络 ### ### 1. 序列模型概述 循环神经网络(RNN)之类的模型在语音识别、自然语言处理和其他领域中引起变革。  ## 数学符号 在这里 $ x^{<1>} $ 表示Harry这个单词,它就是一个第4075行是1,其余值都是0的向 卷积神经网络或全连接网络的局限性 · 同一层节点之间无关联,从而导致获取时序规则方面功能不足 ## • 循环神经网络可以解决时序问题 · 基于语言模型(LM),故可以捕捉时序规则信息 它是如何实现的? ### 2. 循环神经网络(RNN) 01 序列模型概述 02 循环神经网络(RNN) 03 长短期记忆(LSTM) 04 双向循环神经网络 05 深层循环神经网络 ### 2. 循环神经网络(RNN)0 码力 | 29 页 | 1.68 MB | 2 年前3
Java 应用与开发 - Java 内存模型与分配机制Java 内存模型与分配机制 王晓东 wangxiaodongQouc.edu.cn 中国海洋大学 September 30, 2018 Java 内 学习目标 1. 理解 JVM 内存模型,掌握 JVM 内存构成 2. 理解 Java 程序的运行过程,学会通过调 HH 变化 3. 了解 Java 内存管理,认识垃圾回收 4. 建立编程时高效利用内存、避免内存溢上 D 的理 试模式观察内存的 大网 Java 内存模型 Java 程序内存运行分析 Java 内存管理建议 大纲 Java 内存模型 Java 程序内存运行分析 Java 内存管理建议 大网 Java 内存模型 Java 程序内存运行分析 Java 内存管理建议 接下来… Java 内存模型 大网 Java 内存模型 Java 内存管理建议 Java 虚拟机 (Java Virtual Machine, JVM ) *0 码力 | 44 页 | 818.30 KB | 2 年前3
共 1000 条
- 1
- 2
- 3
- 4
- 5
- 6
- 100













