三端一体化 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

开源中国 2023 大模型(LLM)技术报告

面，支持快速迭代和大规模部署。Amazon SageMaker、Google Cloud AI Platform 和 Microsoft Azure Machine Learning 都是提供端到端机器学习服务的云平台。这些工具和库专门为加速机器学习模型的训练和推理而设计，通常利用 GPU 或 TPU 等硬件。这类工具可以显著提高训练和推理的速度，使得处理大规模数据集和复杂模型变得可行。NVIDIA 比较有代表性的 LLM 开发工具有：：帮助用户极致优化给大模型的提示词（prompt），使得对大语言模型提问时，可以获得更理想的输出。：用于语义搜索、LLM 编排和语言模型工作流的一体化嵌入数据库，可以使用 SQL、对象存储、主题建模、图形分析和多模态索引进行矢量搜索。：专注以 Sketch、PSD、静态图片等形式的视觉稿作为输入，通过智能化技术一键生成可维护的前端代码，包含视图代码、制造商，提供了强大的图形处理单元，专门用于深度学习和AI计算。 AI 处理器和基础软件构建 Atlas 人工智能计算解决方案，打造面向“端、边、云”的全场景 AI 基础设施方案，覆盖深度学习领域推理和训练全流程。被外界视为打破 NVIDIA 垄断 AI 算力市场的多一种选择，其基于第三代 CDNA 架构，为生成式 AI 大语言模型设计的 MI300X 内存高达 192GB，集成了高达 1530 亿个晶体管，为历代产品

0 码力 | 32 页 | 13.09 MB | 1 年前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

可解释性：注重模型输出的可解释性和透明性。 DeepSeek R1  高效推理：专注于低延迟和高吞吐量，适合实时应用。  轻量化设计：模型结构优化，资源占用少，适合边缘设备和移动端。  多任务支持：支持多种任务，如文本生成、分类和问答。 Kimi k1.5  垂直领域优化：针对特定领域（如医疗、法律）进行优化，提供高精度结果。  长文本处理：擅长处理长文本详细全面地提取文本数据，并集成可视化表格，但受大样本或模型稳定性影响，输出表格末尾缺失，需要重复尝试生成。长文本（15000token）：暂时无法给出答复。【所需阅读文本】请根据以上文本完成以下三个任务：1、阅读文本内容；2、整理集成可视化的数据表格；3、按照日期规范排序（直接分析并输出结果，不使用python）提示词测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响，参考，无法作为决策制定、质量评估或产品验证的最终依据。文本数据集成  一般文本处理任务中，DeepSeek R1所提取的文本数据维度最为全面，但容易受文本长度或模型稳定性影响出现失误；其他三个模型在文本数据提取过程中，都存在对部分数据的忽略问题，没有完整集成到可视化表格中；  长文本处理任务中，Kimi k1.5相较短文本处理表现更加突出，提取准确的同时数据维度更加全面；由于文本过长DeepSeek

0 码力 | 85 页 | 8.31 MB | 8 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

从数字空间中的AI，走向能理解和操控物理空间的AI  从解决现实问题的AI，走向解决科学问题的科学型AI 大模型AI 智能体AI 物理AI 科学AI 10政企、创业者必读面对全球大模型产业之争，要打赢「三大战役」 AGI之战应用场景之战大模型安全之战 • 探索超越人类的超级人工智能AGI • 不仅是科技之争，更是国运之争 • 不发展是最大的不安全，发挥举国体制优势，打赢追赶之战 • DeepSeek出现之前的十大预判之二慢思考成为新的发展模式  大模型发展范式正在从「预训练」转向「后训练」和「推理时计算」  大模型厂商都在探索慢思考、思维链技术政企、创业者必读 DeepSeek出现之前的十大预判之三模型越做越专  除了少数科技巨头，大多数公司都专注于做专业大模型  MoE架构盛行，本质是多个专家模型组成一个大模型  Deepmind的Alpha系列产品是这一趋势的最佳诠释 16政企、创业者必读 law范式，走堆显卡路线，如 “星际之门”计划  中国DeepSeek-R1的创新突破，诞生推理型Scaling Law，改写AI发展方向 30政企、创业者必读 DeepSeek在用户体验上实现了三件事  更加理解用户需求，降低Prompt要求  直接呈现思维过程，展现像真人一样思考的能力  可实时联网，把搜索能力与推理能力结合 DeepSeek颠覆式创新——用户体验具备强大推理能力，思维过程更加缜密，智能性提升

0 码力 | 76 页 | 5.02 MB | 5 月前
3
Deepseek R1 本地部署完全手册

DeepSeek-R1-Distill- 70B 70B BF16 ≥180GB 4*L20 或 2*H20 GPU 三、国产芯⽚与硬件适配⽅案 1. 国内⽣态合作伙伴动态企业适配内容性能对标（vs NVIDIA）华为昇腾昇腾910B原⽣⽀持R1全系列，提供端到端推理优化⽅案等效A100（FP16）沐曦 GPU MXN系列⽀持70B模型BF16推理，显存利⽤率提升 30%

0 码力 | 7 页 | 932.77 KB | 8 月前
3
清华大学 DeepSeek 从入门到精通

例生成代码生成 • 根据需求生成代码片段（Python、 JavaScript） • 自动补全与注释生成常规绘图如何使用DeepSeek？网页端：https://chat.deepseek.com APP：DeepSeek 如何从入门到精通？当人人都会用AI时，你如何用得更好更出彩？推理模型 • 例如：DeepSeek-R1，G “我需要优化用户登录流程，请分析当前瓶颈并提出3种方案。” ✅ 激发模型深层推理 ❌ 需清晰定义需求边界混合模式结合需求描述与关键约束条件平衡灵活性与可控性 “设计一个杭州三日游计划，要求包含西湖和灵隐寺，且预算控制在2000元内。” ✅ 兼顾目标与细节 ❌ 需避免过度约束启发式提问通过提问引导模型主动思考（如“为什么”“如何”）探索性问题、需模型解示例（有效提示）需避免的提示策略数学证明推理模型直接提问，无需分步引导 “证明勾股定理” 冗余拆解（如“先画图，再列公式”）通用模型显式要求分步思考，提供示例 “请分三步推导勾股定理，参考： 1. 画直角三角形…” 直接提问（易跳过关键步骤）创意写作推理模型鼓励发散性，设定角色/风格 “以海明威的风格写一个冒险故事” 过度约束逻辑（如“按时间顺序列出”）通用模型需明确约束目标，避免自由发挥

0 码力 | 103 页 | 5.40 MB | 8 月前
3
DeepSeek-R1使用指南（简版）

DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端

0 码力 | 25 页 | 5.57 MB | 8 月前
3
普通人学AI指南

15T tokens 的训练数据，在推理、数学、代码生成、指令跟踪等能力获得大幅度提升。 3.1 大模型 Llama3 3.1.1 步骤 1：安装 Ollama Ollama 可以简单理解为客户端，实现和大模型的交互。ollama 软件 win 和 mac 都包括，如图 11 所示。 13 Figure 11: Ollama 下载在这里已经为大家准备好，只需要在我的微信公众号郭震 AI，回复消息：畅享使用大模型！ Figure 20: 使用开源 LobeChat 搭建美观的大模型前端界面 19 4.1 LobeChat 开源框架，经过我的调研，发现 LobeChat 是目前最优化、最美观和炫酷的前端界面，适配各个大模型，支持文字、语音、图片的多模态交互。 4.2 步骤一安装 docker 4.2.1 了解 docker 基本用法 Docker 是一个开源的容器化平台，旨在开发、部署和运行应用。它利用容器来当前终端。 --name lobe-chat ：给容器分配一个名称 lobe-chat 。这有助于以后通过名称管理容器。 -p 10084:3210 ：将主机的 10084 端口映射到容器的 3210 端口。这样，主机的 10084 端口的请求会被转发到容器的 3210 端口。 -e

0 码力 | 42 页 | 8.39 MB | 8 月前
3
DeepSeek从入门到精通(20250204)

“我需要优化用户登录流程，请分析当前瓶颈并提出3种方案。” ✅ 激发模型深层推理 ❌ 需清晰定义需求边界混合模式结合需求描述与关键约束条件平衡灵活性与可控性 “设计一个杭州三日游计划，要求包含西湖和灵隐寺，且预算控制在2000元内。” ✅ 兼顾目标与细节 ❌ 需避免过度约束启发式提问通过提问引导模型主动思考（如“为什么”“如何”）探索性问题、需模型解示例（有效提示）需避免的提示策略数学证明推理模型直接提问，无需分步引导 “证明勾股定理” 冗余拆解（如“先画图，再列公式”）通用模型显式要求分步思考，提供示例 “请分三步推导勾股定理，参考： 1. 画直角三角形…” 直接提问（易跳过关键步骤）创意写作推理模型鼓励发散性，设定角色/风格 “以海明威的风格写一个冒险故事” 过度约束逻辑（如“按时间顺序列出”）通用模型需明确约束目标，避免自由发挥 “先解释快速排序原理，再写出代码并测试示例” 模糊需求（如“写个排序代码”）多轮对话通用模型自然交互，无需结构化指令 “你觉得人工智能的未来会怎样？” 强制逻辑链条（如“分三点回答”）推理模型需明确对话目标，避免开放发散 “从技术、伦理、经济三方面分析 AI的未来” 情感化提问（如“你害怕AI吗？”）逻辑分析推理模型直接抛出复杂问题 “分析‘电车难题’中的功利主义与道德主义冲突” 添加主观引导（如“你认为哪种对？”）

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学普通人如何抓住DeepSeek红利

· 散点图 · 雷达图 · 组合图表 SVG矢量图 · 基础图形 · 图标 · 简单插图 · 流程图 · 组织架构图常规绘图 DeepSeek的深度思考过程独树一帜《香料三重奏》茄椒肠卷配酸奶薄荷酱 ??? 灵感地图：巴尔干半岛香料 × 地中海清新感 × 日式天妇罗手法 ??? 结构解构： 1.青椒薄片 - 采用日式天妇罗手法炸至半透明，形成琥珀色脆网 2.茄泥慕斯，用表格展示。” p 模板复制：对同类章节（如3.1/3.2/3.3）使用相同指令模板，仅替换关键词。 p 强制格式：要求AI输出带编号小标题、分点、表格的内容，直接粘贴后即显“专业感”。第三阶段：20分钟——用AI补全软性内容（目标：1000字）填充“虚但必需”的部分： p 政策背书： “生成5条2023年国家层面支持智能物流园区的政策原文（带发文号），并解读对本案的指导意义。” 第四阶段：10分钟——用AI优化与格式伪装 p统一话术： “将以下段落改写成政府报告风格，加入‘数字化转型’‘双碳战略’等关键词：{粘贴原文}” p生成图表：指令：“将上文‘设备配置表’转换成LaTeX格式的三线表。”插入图表后，自动增加方案“厚度”。 p最终润色： “检查以下方案书逻辑漏洞，列出3个可能被客户质疑的点，并给出应对答案。” p关键提醒： ü 保命优先级：先堆字数再优化，前30分钟专注“把文档撑到10000字”。

0 码力 | 65 页 | 4.47 MB | 8 月前
3
清华大学第二弹：DeepSeek赋能职场

- PII Data Detecti on 金牌金山办公2024中文文本智能校对大赛第二名 2024 法研杯法律要素争议焦点识别第二名 AFAC2024金融智能创新大赛金融工具学习三等奖 Googl e kaggl e全球专利文件短语相似性匹配金牌 Googl e kaggl e全球自动问答比赛金牌 Googl e kaggl e全球医疗对话理解金牌 2021全球人 2021年全国知识图谱与语义计算大会-医疗科普知识答非所问识别第一名互联网虛假新闻检测2019全球挑战赛-虛假新闻多模态检测第一名中国法研杯CAIL2020司法人工智能赛第一名 DeepSeek的三种模式平台地址版本备注英伟达NIM微服务 https://build.nvidia.com/d eepseek-ai/deepseek-r1 671B（全量模型）网页版直接使用，支持A com/groqclou d-makes-deepseek-r1- distill-llama-70b-available 70B 邮箱注册，速度快，但感觉比Cerebras弱一些。 …… DeepSeek 三种模式对比 • 基础模型（V3）：通用模型（2024.12），高效便捷，适用于绝大多数任务，“ ”任务 • 深度思考（R1）：推理模型，复杂推理和深度分析任务，如数理逻辑推理和编程代码，“ ”任务

0 码力 | 35 页 | 9.78 MB | 8 月前
3

共 15 条前往

页

分类

语言

格式