清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单性能之间取得平衡,适合 中等规模任务。 多模态支持:支持文本和 图像处理,扩展应用场景。 可解释性:注重模型输出 的可解释性和透明性。 DeepSeek R1 高效推理:专注于低延迟和 高吞吐量,适合实时应用。 轻量化设计:模型结构优化, 资源占用少,适合边缘设备 和移动端。 多任务支持:支持多种任务, 如文本生成、分类和问答。 Kimi k1.5 垂直领域优化:针对特定领域 负责图表逻辑优化 数据采集 数据预处理 数据分析 可视化呈现 新思路:DeepSeek R1的数据应用 中 文 数 据 处 理 优 势 创 意 写 作 生 成 能 力 数 据 读 取 分 析 能 力 低 成 本 高 性 能 优 势 编 程 代 码 生 成 能 力 • 智 能 中 文 古 籍 修 复 与 注 释 : 利用 DeepSeek R1强大的中文理解能力,自动识 别并修复古籍中的破损文字,同时生成准确的 图示(如文献关键词共现图)直观展示综述内容,帮助 用户更好理解和呈现研究成果。 无数据检索:以现有真实数据库作为支撑,通过关键词 检索,自动搜集相关文献并生成综述报告,目前只支持 英文检索。 低重复率:结合现有查重机制与AI技术,在内容生成阶 段引入重复检测与优化策略,从源头上降低重复率风险, 所生成的综述普通重复率与AIGC重复率均在5%以下。 无限双语数据导入:支持中文与英文文献的导入,并且0 码力 | 85 页 | 8.31 MB | 8 月前3
Deepseek R1 本地部署完全手册适⽤场景 硅基流动 官⽅推荐API,低延迟,⽀持多模态模型 企业级⾼并发推理 腾讯云 ⼀键部署+限时免费体验,⽀持VPC私有化 中⼩规模模型快速上线 PPIO派欧云 价格仅为OpenAI 1/20,注册赠5000万tokens 低成本尝鲜与测试 2. 国际接⼊渠道(需魔法或外企上⽹环境 ) 英伟达NIM:企业级GPU集群部署(链接) Groq:超低延迟推理(链接) 五、完整671B sh)" brew install llama.cpp 2. 下载并合并模型分⽚: 3. 安装Ollama: 4. 创建Modelfile: 5. 运⾏模型: 4. 性能调优与测试 GPU利⽤率低:升级⾼带宽内存(如DDR5 5600+)。 扩展交换空间: 六、注意事项与⻛险提示 1. 成本警示: 70B模型:需3张以上80G显存显卡(如RTX A6000),单卡⽤户不可⾏。 6710 码力 | 7 页 | 932.77 KB | 8 月前3
DeepSeek从入门到精通(20250204)理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 问题的每个步骤来得到答案 决策能力 依赖预设算法和规则进行决策 输出格 式 自主优化步骤,兼顾效率 与正确性 严格按指令执行,无自主优化 提示语示例 决策需求 验证性需求 "为降低物流成本,现有两种方案: ①自建区域仓库(初期投入高,长期成本低) ②与第三方合作(按需付费,灵活性高) 请根据ROI计算模型,对比5年内的总成本并推荐最优 解。" �实战技巧: "以下是某论文结论:'神经网络模型A优于传统方法B'。 请验证: 逻辑推理和 抽象能力 典型错误表现 数据误用 有数据 低 高 高 中 误用已有数据,回答 部分不符或细节错误 语境误解 有数据 高 低 高 中 对问题的意图理解错 误,回答偏离主题 信息缺失 无数据 中 高 低 中 未能正确获取或整合 外部信息 推理错误 部分数据 高 高 中 低 逻辑推理中存在漏洞 或错误假设 无中生有 无数据 低 中 低 低 在无数据支持下,生 成完全虚构的信息 AI幻觉:五类七特0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 问题的每个步骤来得到答案 决策能力 依赖预设算法和规则进行决策 输出格 式 自主优化步骤,兼顾效率 与正确性 严格按指令执行,无自主优化 提示语示例 决策需求 验证性需求 "为降低物流成本,现有两种方案: ①自建区域仓库(初期投入高,长期成本低) ②与第三方合作(按需付费,灵活性高) 请根据ROI计算模型,对比5年内的总成本并推荐最优 解。" �实战技巧: "以下是某论文结论:'神经网络模型A优于传统方法B'。 请验证: 逻辑推理和 抽象能力 典型错误表现 数据误用 有数据 低 高 高 中 误用已有数据,回答 部分不符或细节错误 语境误解 有数据 高 低 高 中 对问题的意图理解错 误,回答偏离主题 信息缺失 无数据 中 高 低 中 未能正确获取或整合 外部信息 推理错误 部分数据 高 高 中 低 逻辑推理中存在漏洞 或错误假设 无中生有 无数据 低 中 低 低 在无数据支持下,生 成完全虚构的信息 AI幻觉:五类七特0 码力 | 103 页 | 5.40 MB | 8 月前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502增长 大模型能以更少的参数量达到更高的性能 360联合北大研发:5%参数量逼近Deepseek-R1满血性能 18政企、创业者必读 DeepSeek出现之前的十大预判 之六 成本越来越低 过去一年,大模型成本「自由落体」 国外:GPT-4等效智能在过去18个月内价格下降240倍 国内:大模型「亏本」卖,可以「白嫖」大模型API能力 19政企、创业者必读 DeepSeek出现之前的十大预判 DeepSeek颠覆式创新——技术创新 27 DeepSeek-R1和GPT-4o不是同一个物种政企、创业者必读 快思考 慢思考 快 慢 人类真正智力表现 的形式 直觉经验型 速度快、准确性低 GPT、DeepSeek-V3擅长的 思考方式 推理能力获得突破的关键是学会了「慢思考」 例:课堂提问 快问快答 长思维链强大的推理能力是真正人类智力的体现 预训练大模型是人记忆和学习的能力,推理模型是对复杂问题 41政企、创业者必读 DeepSeek六大应用方向之四 未来产业:变不可能为可能 42 DeepSeek的技术为机器人、智能网联车、无人机、机器狗 等带来巨大改进,降低成本和算力要求 低成本低算力需求使得模型更容易被部署到机器人等智能设 备上,解决物理现实世界的认知、决策和行动问题政企、创业者必读 赋予自动驾驶复杂物理世界理解能力 从规则驱动到学习驱动 43政企、创业者必读 0 码力 | 76 页 | 5.02 MB | 6 月前3
清华大学 普通人如何抓住DeepSeek红利减少了对培训资源的依赖,新员工可以通过DeepSeek 自主学习,降低培训成本。通过提高工作效率,减少了 人力资源的浪费,降低了整体运营成本。 场景3:日常客户沟通与问题反馈处理 常见问题: 与甲方客户的沟通效率低,信息不对称,导致响应不及时或错误 场景:在日常与甲方客户的沟通中,客户服务人员或项目经理经常需要快速响应客户的各种问 题,例如: • 我们公司的最新促销活动是什么? • 我的订单状态是怎样的? 请 验 证 : ① 实验数据是否支持该结论; ② 检查对照组设置是否存在偏差; ③ 重新计算p 值并判断显著性。" "为降低物流成本,现有两种方案: ①自建区域仓库(初期投入高,长期成本低) ②与第三方合作(按需付费,灵活性高) 请根据ROl 计算模型,对比5年内的总成本并推荐最优 解。" "分析近三年新能源汽车销量数据(附CSV), 说 明 : ① 增长趋势与政策关联性;0 码力 | 65 页 | 4.47 MB | 8 月前3
清华大学第二弹:DeepSeek赋能职场Route (路径灵活性) 线性路径 (流程标准化) 网状路径 (多路径探索) Responsiveness (响应模式) 被动适配 (按规则执行) 主动创新 (自主决策) Risk (风险特征) 低风险 (稳定可控) 高风险 (不确定性高) (限定于文本生成任务) DeepSeek 两种模型对比 V3 R1 DeepSeek 两种模型对比 V3 R1 如何提问?两种模型的提示语差异0 码力 | 35 页 | 9.78 MB | 8 月前3
开源中国 2023 大模型(LLM)技术报告-ai-in-the-enterprise/ 21 / 32 AI 编程工具:插件、IDE、终端 目前最常见的 AI 编程工具大多以插件、IDE 和终端 的形式出现,它们大多交互直观且使用门槛低,大大 提高了 AI 编程工具的使用率。 GitHub Copilot 和 Codeium 是比较常见的 AI 编程 插件,而 Cursor 和 Warp 分别是具有 AI 编程能力 的 IDE 和终端工具。0 码力 | 32 页 | 13.09 MB | 1 年前3
共 8 条
- 1













