清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单效率的双重优化。DeepSeek选择了多个开源模型作为蒸馏的 目标模型,包括Qwen 系列和Llama 系列 架构创新 通过将模型划分为多个专家模块,实 现高效计算和推理。DeepSeek通过 无辅助损失的自然负载均衡和共享专 家机制,解决了专家模块工作量不平 衡的问题。 混合专家(MoE)架构 通过低秩压缩减少推理时的内存占用, 同时保持与传统多头注意力(MHA) 相当的性能。MLA在训练中减少了 处理复杂学术、法律、市场研究,支持多轮分析 生成创意内容,提供建议,适度推理分析 输入输出格式 支持图像、PDF等多种格式输入输出 主要依赖文本输入输出 模块协作 多个模块协同工作(探索者、整合者、推理者等) 单一模型,无模块化协作 DeepResearch 探索者 整合者 思考者 表达者 技术协同:多步推理,快速输出 DeepResearch能迅速梳理海量文献, 提炼关键信息,显著提升文献综述效率。 文献综述加速 近三年124篇核心论文摘要 2.关键临床试验数据 3.汇总技术路线对比图谱 4.待突破方向预测 5.符合APA格式的参考文献库 科研场景实测: 获得: 学术研究案例:明确需求,报告生成 通过百度网盘分享的文件:deep Research功能深度研究.docx 链接: https://pan.baidu.com/s/1pyaygXqFXvRe-In7gn5gOA?pwd=fn7s 提取码: fn7s0 码力 | 85 页 | 8.31 MB | 8 月前3
清华大学 普通人如何抓住DeepSeek红利•第3层:辣肠碎粒带来咸鲜微辣的颗粒感 •终章:薄荷冷萃油在舌尖炸开极地般的清凉 ??? 分子料理技法: 1.反卷造型:将传统卷物内外翻转,脆网外露包裹柔嫩内馅 2.温差游戏:65℃温热慕斯与-196℃冷萃油同盘 3.质构悖论:看似坚硬的脆片入口即碎,柔软慕斯中暗藏爆破脆粒 如何使用DeepSeek解决工作中的问题 “卷不动了?让DeepSeek帮你一键‘躺赢’!” 场景1:1小时内写完一个1万字的项目书 会现象(如极化和错误信息传播)中的表现,特别 是引入偏误信息后的意见动态变化。使用大模型模 拟多个虚拟代理,讨论“气候变暖”、“转基因食 品的安全性”和“疫苗的有效性和安全性”三个具 有科学共识的话题。 实验一在无偏误信息条件下,代理通过社交网络进 行每日对话,记录最终信念状态和信息传播路径。 实验二改变初始信念分布,探讨初始条件对结果的 影响。实验三引入10%代理发布的偏误信息,观察 其对信念动态的影响。50个代理人在30天内共生成 194699条对话。 50个智能体的在线社区模拟仿真 场景3:多智能体在线社区模拟 p 为了观测偏误信息加入后50个代理意 见动态的具体呈现,研究通过依存关系 构造三个科学共识的语义图谱,并和无 偏误状态进行对比。对每个科学共识议 题,选择图中最有代表性的40个实体 (基于节点的度)。 p 在自然语言处理中,依存关系是用于描 述句子中词与词之间的关系,帮助揭示 句子的句法结构。包括nsubj(名词性0 码力 | 65 页 | 4.47 MB | 8 月前3
DeepSeek图解10页PDF传至云端,确保敏感信息不被第三方访问。 2. 可定制化与优化。支持微调(Fine-tuning):可以根据特定业务需求对模 型进行微调,以适应特定任务,如行业术语、企业内部知识库等。 3. 离线运行,适用于无网络环境。可在离线环境下运行:适用于无互联网 连接或网络受限的场景。提高系统稳定性:即使云服务宕机,本地大模型依 然可以正常工作,不受外部因素影响。 本教程搭建 DeepSeek 好处 本地搭建 DeepSeek DeepSeek 本地部署三个步骤 一共只需要三步,就能做到 DeepSeek 在本地运行并与它对话。 第一步,使用的是 ollama 管理各种不同大模型,ollama 比较直接、干净, 一键下载后安装就行,安装过程基本都是下一步。 不知道去哪里下载的,可以直接在我的公众号后台回复:ollama,下载这个 软件,然后装上,可以拿着手机扫码下图1直达我的公众号: 教程作者:郭震,工作 8 年目前美国 AI 博士在读,公众号:郭震 AI,欢迎关注获取更多原创教程。资 料用心打磨且开源,是为了帮助更多人了解获取 AI 知识,严禁拿此资料引流、出书、等形式的商业活动 图 1: 我的公众号:郭震 AI 安装后,打开命令窗口,输入 ollama,然后就能看到它的相关指令,一共 10 个左右的命令,如下图2所示,就能帮我们管理好不同大模型: 图 2: Ollama 常用的命令 第二步,命令窗口输入:ollama0 码力 | 11 页 | 2.64 MB | 8 月前3
TVM工具组工具链产品 平头哥芯片平台发布的配套软件中, TVM 是工具链产品的重要组成部分: 负责将预训练好的 caffe 或者 tensorflow 的模型,转换到 LLVM IR,最后生成可以在无剑 SoC 平台上 执行的二进制。绝赞招聘中 为何添加 caffe 前端? 客户需求 评估阶段:客户用于评估芯片的网络,caffe 模型占很大比重。 竞品已支持 caffe 前端 当前各大芯片厂商的部署工具大多数都支持,支持 前端有利于提高竞争力。 开源社区 存量的开源 caffe 网络模型众多,TVM 直接支持 caffe 让大家更方便尝试 caffe 资源。绝赞招聘中 当前进度 无 caffe 依赖 from_caffe 直接导入 caffe 模型文件,不需要预先安装 caffe 。 net 已测试网络:alexnet / densenet121 / inception v1 / inception v3 / inception0 码力 | 6 页 | 326.80 KB | 6 月前3
普通人学AI指南. . . . . . . . . . . . . . . . . . . . . . . . . 13 3.1.1 步骤 1:安装 Ollama . . . . . . . . . . . . . . . . . . . . . 13 3.1.2 步骤 2:安装 Llama . . . . . . . . . . . . . . . . . . . . . 14 3.1.3 使用 Llama3 . . . 15 3.2 大模型 phi-3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 3.2.1 Ollama 安装 phi-3 . . . . . . . . . . . . . . . . . . . . . . 17 3.2.2 使用 phi-3 . . . . . . . . . . . . . . . 零代码搭建本地 AI 前端 19 4.1 LobeChat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 4.2 步骤一安装 docker . . . . . . . . . . . . . . . . . . . . . . . . . . 20 4.2.1 了解 docker 基本用法 . . . . . . .0 码力 | 42 页 | 8.39 MB | 8 月前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502认知决定行动,这场全民AI科普对推动中国AI发展功不可没政企、创业者必读 开源改变行业格局,建立强大生态 开源战胜闭源,促使全球公司、开发者等转到开源 建立强大生态,成为全球人工智能根技术,无推广情况下各国 政府、企业、云厂商纷纷接入,获得全球最大影响力 改变中美竞争格局:美国是闭源封闭垄断思路,中国领导开源 文化,加速中国领先地位 中国人民使用的AI工具先进性已超过美国,普及率超过美国, 如何解决 DeepSeek在政府、企业的应用问题? 49政企、创业者必读 闭源云端通用大模型功能强大 但在政府企业场景中使用存在若干问题 训练知识为网上通用,缺少政府和企业内部知识,不懂业务,无 法解决实际问题 闭源模型云端部署,使用过程中数据外传上网,存在泄密风险 闭源模型规模庞大,无法为企业进行定制,无法本地部署 成本高昂,一般企业难以负担 50政企、创业者必读 业务系统 员工/岗位 组织团队 业务流程 核心业务 智能体 企业要躬身入局,以自身业务驱动,打造专有智能体 63政企、创业者必读 智能体在企业应用的七层能力 与大模型直接聊天,输入简单提示词,无Agent能力 具备简单GUI交互界面,可进行一些设置 用内部提示词进行角色设定 具备GUI界面的多个步骤的工具软件 L2 L1 L0 可执行复杂的规划、推理、分解、预测流程的工作流 与企业业务流程、组织、系统打通0 码力 | 76 页 | 5.02 MB | 6 月前3
Deepseek R1 本地部署完全手册部署步骤(Linux示例) 1. 安装依赖⼯具: # 安装llama.cpp(⽤于合并分⽚⽂件) /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" brew install llama.cpp 2. 下载并合并模型分⽚: 3. 安装Ollama: 4. 创建Modelfile:0 码力 | 7 页 | 932.77 KB | 8 月前3
国家人工智能产业综合标准化体系建设指南(2024版)语言处理、智能语音、计算机视觉、生物特征识别、人机混合增 强智能、智能体、群体智能、跨媒体智能、具身智能等标准。 1. 机器学习标准。规范机器学习的训练数据、数据预处理、 模型表达和格式、模型效果评价等,包括自监督学习、无监督学 习、半监督学习、深度学习、强化学习等标准。 2. 知识图谱标准。规范知识图谱的描述、构建、运维、共 享、管理和应用,包括知识表示与建模、知识获取与存储、知识 融合与可视化、知识计算与管理、知识图谱质量评价与互联互通、0 码力 | 13 页 | 701.84 KB | 1 年前3
DeepSeek-V2: A Strong, Economical, and Efficient
Mixture-of-Experts Language Model美丽而又心灵手巧的姑娘,迈着纤纤细步款款而来,她挥舞剪刀,尽情地展示 那高超的女工技巧,她先裁出了柳叶,随着柳条袅袅依依地舞蹈,又裁出杏 叶,桃叶。 该翻译所对应的古诗文是: OPTIONS - 春风骋巧如翦刀 - 剪裁无巧似春风 - 风吹怨恨快如刀 - 春风欲擅秋风巧 Table 17 | An example of CCPM. 38 PROMPT Q: 某 小 学 在“献 爱 心–为 汶 川 地 震 区 捐 款”活0 码力 | 52 页 | 1.23 MB | 1 年前3
DeepSeek从入门到精通(20250204)自主设计验证路径并排查 矛盾 简单确认,缺乏深度推演 5. 执行需求 需完成具体操作(代码/ 计算/流程) 任务 + 步骤约束 + 输出格 式 自主优化步骤,兼顾效率 与正确性 严格按指令执行,无自主优化 提示语示例 决策需求 验证性需求 "为降低物流成本,现有两种方案: ①自建区域仓库(初期投入高,长期成本低) ②与第三方合作(按需付费,灵活性高) 请根据ROI计算模型,对比5年内的总成本并推荐最优0 码力 | 104 页 | 5.37 MB | 8 月前3
共 11 条
- 1
- 2













