开源中国 2023 大模型(LLM)技术报告面,支 持快速迭代和大规模部署。Amazon SageMaker、Google Cloud AI Platform 和 Microsoft Azure Machine Learning 都是提供端到 端机器学习服务的云平台。 这些工具和库专门为加速机器学习模型的训练和推理而设计,通常利 用 GPU 或 TPU 等硬件。这类工具可以显著提高训练和推理的速度, 使得处理大规模数据集和复杂模型变得可行。NVIDIA 比较有代表性的 LLM 开发工具有: :帮助用户极致优化 给大模型的提示词(prompt),使得对大语 言模型提问时,可以获得更理想的输出。 :用于语义搜索、LLM 编排和语言模 型工作流的一体化嵌入数据库,可以使用 SQL、对象存储、主题建模、图形分析和多模 态索引进行矢量搜索。 :专注以 Sketch、PSD、静态 图片等形式的视觉稿作为输入,通过智能化技 术一键生成可维护的前端代码,包含视图代码、 制造商,提供了强大的图形处理单元,专门用于深度学习和AI计算。 AI 处理器和基础软件构建 Atlas 人工智能计算解决 方案,打造面向“端、边、云”的全场景 AI 基础设施方案,覆盖深度学习领域推理和训练全流程。 被外界视为打破 NVIDIA 垄断 AI 算力市场的多一种选择,其基于第三代 CDNA 架构,为生 成式 AI 大语言模型设计的 MI300X 内存高达 192GB,集成了高达 1530 亿个晶体管,为历代产品0 码力 | 32 页 | 13.09 MB | 1 年前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单可解释性:注重模型输出 的可解释性和透明性。 DeepSeek R1 高效推理:专注于低延迟和 高吞吐量,适合实时应用。 轻量化设计:模型结构优化, 资源占用少,适合边缘设备 和移动端。 多任务支持:支持多种任务, 如文本生成、分类和问答。 Kimi k1.5 垂直领域优化:针对特定领域 (如医疗、法律)进行优化, 提供高精度结果。 长文本处理:擅长处理长文本 详细全面地提取文本数据,并 集成可视化表格,但受大样本 或模型稳定性影响,输出表格 末尾缺失,需要重复尝试生成。 长文本(15000token):暂时 无法给出答复。 【所需阅读文本】请根据以上文本完成以下三个任务:1、阅读 文本内容;2、整理集成可视化的数据表格;3、按照日期规范排 序(直接分析并输出结果,不使用python) 提示词 测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响, 参考,无法作为决策制定、质量评估或产品验证的最终依据。 文本数据集成 一般文本处理任务中,DeepSeek R1所提取的文本数据维度最为全面,但容易受文本长度或模型稳定性影响出现失误;其他三个模型在文本数 据提取过程中,都存在对部分数据的忽略问题,没有完整集成到可视化表格中; 长文本处理任务中,Kimi k1.5相较短文本处理表现更加突出,提取准确的同时数据维度更加全面;由于文本过长DeepSeek0 码力 | 85 页 | 8.31 MB | 8 月前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502从数字空间中的AI,走向能理解和操控物理空间的AI 从解决现实问题的AI,走向解决科学问题的科学型AI 大模型AI 智能体AI 物理AI 科学AI 10政企、创业者必读 面对全球大模型产业之争,要打赢「三大战役」 AGI之战 应用场景之战 大模型安全之战 • 探索超越人类的超级人工 智能AGI • 不仅是科技之争,更是国 运之争 • 不发展是最大的不安全, 发挥举国体制优势,打赢 追赶之战 • DeepSeek出现之前的十大预判 之二 慢思考成为新的发展模式 大模型发展范式正在从「预训练」转向「后训练」和「推理时计算」 大模型厂商都在探索慢思考、思维链技术政企、创业者必读 DeepSeek出现之前的十大预判 之三 模型越做越专 除了少数科技巨头,大多数公司都专注于做专业大模型 MoE架构盛行,本质是多个专家模型组成一个大模型 Deepmind的Alpha系列产品是这一趋势的最佳诠释 16政企、创业者必读 law范式,走堆显卡路线,如 “星际之门”计划 中国DeepSeek-R1的创新突破,诞生推理型Scaling Law,改 写AI发展方向 30政企、创业者必读 DeepSeek在用户体验上实现了三件事 更加理解用户需求,降低Prompt要求 直接呈现思维过程,展现像真人一样思考的能力 可实时联网,把搜索能力与推理能力结合 DeepSeek颠覆式创新——用户体验 具备强大推理能力,思维过程更加缜密,智能性提升0 码力 | 76 页 | 5.02 MB | 5 月前3
Deepseek R1 本地部署完全手册DeepSeek-R1-Distill- 70B 70B BF16 ≥180GB 4*L20 或 2*H20 GPU 三、国产芯⽚与硬件适配⽅案 1. 国内⽣态合作伙伴动态 企业 适配内容 性能对标(vs NVIDIA) 华为昇 腾 昇腾910B原⽣⽀持R1全系列,提供端到端推理优化 ⽅案 等效A100(FP16) 沐曦 GPU MXN系列⽀持70B模型BF16推理,显存利⽤率提升 30%0 码力 | 7 页 | 932.77 KB | 8 月前3
清华大学 DeepSeek 从入门到精通例生成 代码生成 • 根 据 需 求 生 成 代 码片段(Python、 JavaScript) • 自 动 补 全 与 注 释 生成 常规绘图 如何使用DeepSeek? 网页端:https://chat.deepseek.com APP:DeepSeek 如何从入门到精通? 当人人都会用AI时,你如何用得更好更出彩? 推理模型 • 例如:DeepSeek-R1,G “我需要优化用户登录流程, 请分析当前瓶颈并提出3种方 案。” ✅ 激发模型深层推理 ❌ 需清晰定义需求边界 混合模式 结合需求描述与关键 约束条件 平衡灵活性与可控性 “设计一个杭州三日游计划, 要求包含西湖和灵隐寺,且 预算控制在2000元内。” ✅ 兼顾目标与细节 ❌ 需避免过度约束 启发式提问 通过提问引导模型主 动思考(如“为什 么”“如何”) 探索性问题、需模型解 示例(有效提示) 需避免的提示策略 数学证明 推理模型 直接提问,无需分步引导 “证明勾股定理” 冗余拆解(如“先画图,再列公式”) 通用模型 显式要求分步思考,提供示例 “请分三步推导勾股定理,参考: 1. 画直角三角形…” 直接提问(易跳过关键步骤) 创意写作 推理模型 鼓励发散性,设定角色/风格 “以海明威的风格写一个冒险故事” 过度约束逻辑(如“按时间顺序列出”) 通用模型 需明确约束目标,避免自由发挥0 码力 | 103 页 | 5.40 MB | 8 月前3
DeepSeek-R1使用指南(简版)DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端0 码力 | 25 页 | 5.57 MB | 8 月前3
普通人学AI指南15T tokens 的训练数据,在推理、数学、 代码生成、指令跟踪等能力获得大幅度提升。 3.1 大模型 Llama3 3.1.1 步骤 1:安装 Ollama Ollama 可以简单理解为客户端,实现和大模型的交互。ollama 软件 win 和 mac 都包括,如图 11 所示。 13 Figure 11: Ollama 下载 在这里已经为大家准备好,只需要在我的微信公众号郭震 AI,回复消息: 畅享使用大模型! Figure 20: 使用开源 LobeChat 搭建美观的大模型前端界面 19 4.1 LobeChat 开源框架,经过我的调研,发现 LobeChat 是目前最优化、最美观和炫酷的前 端界面,适配各个大模型,支持文字、语音、图片的多模态交互。 4.2 步骤一安装 docker 4.2.1 了解 docker 基本用法 Docker 是一个开源的容器化平台,旨在开发、部署和运行应用。它利用容器来 当 前 终 端。 --name lobe-chat : 给 容 器 分 配 一 个 名 称 lobe-chat 。 这 有 助 于 以 后 通 过 名 称 管 理 容 器。 -p 10084:3210 : 将 主 机 的 10084 端 口 映 射 到 容 器 的 3210 端 口。 这 样, 主 机 的 10084 端 口 的 请 求 会 被 转 发 到 容 器 的 3210 端 口。 -e0 码力 | 42 页 | 8.39 MB | 8 月前3
DeepSeek从入门到精通(20250204)“我需要优化用户登录流程, 请分析当前瓶颈并提出3种方 案。” ✅ 激发模型深层推理 ❌ 需清晰定义需求边界 混合模式 结合需求描述与关键 约束条件 平衡灵活性与可控性 “设计一个杭州三日游计划, 要求包含西湖和灵隐寺,且 预算控制在2000元内。” ✅ 兼顾目标与细节 ❌ 需避免过度约束 启发式提问 通过提问引导模型主 动思考(如“为什 么”“如何”) 探索性问题、需模型解 示例(有效提示) 需避免的提示策略 数学证明 推理模型 直接提问,无需分步引导 “证明勾股定理” 冗余拆解(如“先画图,再列公式”) 通用模型 显式要求分步思考,提供示例 “请分三步推导勾股定理,参考: 1. 画直角三角形…” 直接提问(易跳过关键步骤) 创意写作 推理模型 鼓励发散性,设定角色/风格 “以海明威的风格写一个冒险故事” 过度约束逻辑(如“按时间顺序列出”) 通用模型 需明确约束目标,避免自由发挥 “先解释快速排序原理,再写出代 码并测试示例” 模糊需求(如“写个排序代码”) 多轮对话 通用模型 自然交互,无需结构化指令 “你觉得人工智能的未来会怎样?” 强制逻辑链条(如“分三点回答”) 推理模型 需明确对话目标,避免开放发散 “从技术、伦理、经济三方面分析 AI的未来” 情感化提问(如“你害怕AI吗?”) 逻辑分析 推理模型 直接抛出复杂问题 “分析‘电车难题’中的功利主义 与道德主义冲突” 添加主观引导(如“你认为哪种对?”)0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 普通人如何抓住DeepSeek红利· 散点图 · 雷达图 · 组合图表 SVG矢量图 · 基础图形 · 图标 · 简单插图 · 流程图 · 组织架构图 常规绘图 DeepSeek的深度思考过程独树一帜 《香料三重奏》茄椒肠卷配酸奶薄荷酱 ??? 灵感地图:巴尔干半岛香料 × 地中海清新感 × 日式天妇罗手 法 ??? 结构解构: 1.青椒薄片 - 采用日式天妇罗手法炸至半透明,形成琥珀色脆网 2.茄泥慕斯 ,用表格展示。” p 模板复制:对同类章节(如3.1/3.2/3.3)使用相同指令模板,仅替换关键词。 p 强制格式:要求AI输出带编号小标题、分点、表格的内容,直接粘贴后即显“专业感”。 第三阶段:20分钟——用AI补全软性内容(目标:1000字) 填充“虚但必需”的部分: p 政策背书: “生成5条2023年国家层面支持智能物流园区的政策原文(带发文号),并解读对本案的指导意义。” 第四阶段:10分钟——用AI优化与格式伪装 p统一话术: “将以下段落改写成政府报告风格,加入‘数字化转型’‘双碳战略’等关键词:{粘贴原文}” p生成图表: 指令:“将上文‘设备配置表’转换成LaTeX格式的三线表。”插入图表后,自动增加方案“厚度”。 p最终润色: “检查以下方案书逻辑漏洞,列出3个可能被客户质疑的点,并给出应对答案。” p关键提醒: ü 保命优先级:先堆字数再优化,前30分钟专注“把文档撑到10000字”。0 码力 | 65 页 | 4.47 MB | 8 月前3
清华大学第二弹:DeepSeek赋能职场- PII Data Detecti on 金牌 金山办公2024中文文本智能校对大赛 第二名 2024 法研杯 法律要素争议焦点识别 第二名 AFAC2024金融智能创新大赛 金融工具学习 三等奖 Googl e kaggl e全球专利文件短语相似性匹配 金牌 Googl e kaggl e全球自动问答比赛 金牌 Googl e kaggl e全球医疗对话理解 金牌 2021全球人 2021年全国知识图谱与语义计算大会-医疗科普知识答非所问识别 第一名 互联网虛假新闻检测2019全球挑战赛-虛假新闻多模态检测 第一名 中国法研杯CAIL2020司法人工智能赛 第一名 DeepSeek的三种模式 平台 地址 版本 备注 英伟达NIM微服务 https://build.nvidia.com/d eepseek-ai/deepseek-r1 671B(全量模型) 网页版直接使用,支持A com/groqclou d-makes-deepseek-r1- distill-llama-70b-available 70B 邮箱注册,速度快,但感觉比Cerebras弱一些。 …… DeepSeek 三种模式对比 • 基础模型(V3):通用模型(2024.12),高效便捷,适用于绝大多数任务,“ ”任务 • 深度思考(R1):推理模型,复杂推理和深度分析任务,如数理逻辑推理和编程代码,“ ”任务0 码力 | 35 页 | 9.78 MB | 8 月前3
共 15 条
- 1
- 2













