无盘安装 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

效率的双重优化。DeepSeek选择了多个开源模型作为蒸馏的目标模型，包括Qwen 系列和Llama 系列  架构创新通过将模型划分为多个专家模块，实现高效计算和推理。DeepSeek通过无辅助损失的自然负载均衡和共享专家机制，解决了专家模块工作量不平衡的问题。混合专家（MoE）架构通过低秩压缩减少推理时的内存占用，同时保持与传统多头注意力（MHA）相当的性能。MLA在训练中减少了处理复杂学术、法律、市场研究，支持多轮分析生成创意内容，提供建议，适度推理分析输入输出格式支持图像、PDF等多种格式输入输出主要依赖文本输入输出模块协作多个模块协同工作（探索者、整合者、推理者等）单一模型，无模块化协作 DeepResearch 探索者整合者思考者表达者技术协同：多步推理，快速输出 DeepResearch能迅速梳理海量文献，提炼关键信息，显著提升文献综述效率。文献综述加速近三年124篇核心论文摘要 2.关键临床试验数据 3.汇总技术路线对比图谱 4.待突破方向预测 5.符合APA格式的参考文献库科研场景实测: 获得: 学术研究案例：明确需求，报告生成通过百度网盘分享的文件：deep Research功能深度研究.docx 链接: https://pan.baidu.com/s/1pyaygXqFXvRe-In7gn5gOA?pwd=fn7s 提取码: fn7s

0 码力 | 85 页 | 8.31 MB | 8 月前
3
清华大学普通人如何抓住DeepSeek红利

•第3层：辣肠碎粒带来咸鲜微辣的颗粒感 •终章：薄荷冷萃油在舌尖炸开极地般的清凉 ??? 分子料理技法： 1.反卷造型：将传统卷物内外翻转，脆网外露包裹柔嫩内馅 2.温差游戏：65℃温热慕斯与-196℃冷萃油同盘 3.质构悖论：看似坚硬的脆片入口即碎，柔软慕斯中暗藏爆破脆粒如何使用DeepSeek解决工作中的问题 “卷不动了？让DeepSeek帮你一键‘躺赢’！” 场景1：1小时内写完一个1万字的项目书会现象（如极化和错误信息传播）中的表现，特别是引入偏误信息后的意见动态变化。使用大模型模拟多个虚拟代理，讨论“气候变暖”、“转基因食品的安全性”和“疫苗的有效性和安全性”三个具有科学共识的话题。实验一在无偏误信息条件下，代理通过社交网络进行每日对话，记录最终信念状态和信息传播路径。实验二改变初始信念分布，探讨初始条件对结果的影响。实验三引入10%代理发布的偏误信息，观察其对信念动态的影响。50个代理人在30天内共生成 194699条对话。 50个智能体的在线社区模拟仿真场景3：多智能体在线社区模拟 p 为了观测偏误信息加入后50个代理意见动态的具体呈现，研究通过依存关系构造三个科学共识的语义图谱，并和无偏误状态进行对比。对每个科学共识议题，选择图中最有代表性的40个实体（基于节点的度）。 p 在自然语言处理中，依存关系是用于描述句子中词与词之间的关系，帮助揭示句子的句法结构。包括nsubj（名词性

0 码力 | 65 页 | 4.47 MB | 8 月前
3
DeepSeek图解10页PDF

传至云端，确保敏感信息不被第三方访问。 2. 可定制化与优化。支持微调（Fine-tuning）：可以根据特定业务需求对模型进行微调，以适应特定任务，如行业术语、企业内部知识库等。 3. 离线运行，适用于无网络环境。可在离线环境下运行：适用于无互联网连接或网络受限的场景。提高系统稳定性：即使云服务宕机，本地大模型依然可以正常工作，不受外部因素影响。本教程搭建 DeepSeek 好处本地搭建 DeepSeek DeepSeek 本地部署三个步骤一共只需要三步，就能做到 DeepSeek 在本地运行并与它对话。第一步，使用的是 ollama 管理各种不同大模型，ollama 比较直接、干净，一键下载后安装就行，安装过程基本都是下一步。不知道去哪里下载的，可以直接在我的公众号后台回复：ollama，下载这个软件，然后装上，可以拿着手机扫码下图1直达我的公众号：教程作者：郭震，工作 8 年目前美国 AI 博士在读，公众号：郭震 AI，欢迎关注获取更多原创教程。资料用心打磨且开源，是为了帮助更多人了解获取 AI 知识，严禁拿此资料引流、出书、等形式的商业活动图 1: 我的公众号：郭震 AI 安装后，打开命令窗口，输入 ollama，然后就能看到它的相关指令，一共 10 个左右的命令，如下图2所示，就能帮我们管理好不同大模型：图 2: Ollama 常用的命令第二步，命令窗口输入：ollama

0 码力 | 11 页 | 2.64 MB | 8 月前
3
TVM工具组

工具链产品平头哥芯片平台发布的配套软件中， TVM 是工具链产品的重要组成部分：负责将预训练好的 caffe 或者 tensorflow 的模型，转换到 LLVM IR，最后生成可以在无剑 SoC 平台上执行的二进制。绝赞招聘中为何添加 caffe 前端？客户需求评估阶段：客户用于评估芯片的网络，caffe 模型占很大比重。竞品已支持 caffe 前端当前各大芯片厂商的部署工具大多数都支持，支持前端有利于提高竞争力。开源社区存量的开源 caffe 网络模型众多，TVM 直接支持 caffe 让大家更方便尝试 caffe 资源。绝赞招聘中当前进度无 caffe 依赖 from_caffe 直接导入 caffe 模型文件，不需要预先安装 caffe 。 net 已测试网络：alexnet / densenet121 / inception v1 / inception v3 / inception

0 码力 | 6 页 | 326.80 KB | 6 月前
3
普通人学AI指南

. . . . . . . . . . . . . . . . . . . . . . . . . 13 3.1.1 步骤 1：安装 Ollama . . . . . . . . . . . . . . . . . . . . . 13 3.1.2 步骤 2：安装 Llama . . . . . . . . . . . . . . . . . . . . . 14 3.1.3 使用 Llama3 . . . 15 3.2 大模型 phi-3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 3.2.1 Ollama 安装 phi-3 . . . . . . . . . . . . . . . . . . . . . . 17 3.2.2 使用 phi-3 . . . . . . . . . . . . . . . 零代码搭建本地 AI 前端 19 4.1 LobeChat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 4.2 步骤一安装 docker . . . . . . . . . . . . . . . . . . . . . . . . . . 20 4.2.1 了解 docker 基本用法 . . . . . . .

0 码力 | 42 页 | 8.39 MB | 8 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

认知决定行动，这场全民AI科普对推动中国AI发展功不可没政企、创业者必读开源改变行业格局，建立强大生态  开源战胜闭源，促使全球公司、开发者等转到开源  建立强大生态，成为全球人工智能根技术，无推广情况下各国政府、企业、云厂商纷纷接入，获得全球最大影响力  改变中美竞争格局：美国是闭源封闭垄断思路，中国领导开源文化，加速中国领先地位  中国人民使用的AI工具先进性已超过美国，普及率超过美国，如何解决 DeepSeek在政府、企业的应用问题？ 49政企、创业者必读闭源云端通用大模型功能强大但在政府企业场景中使用存在若干问题  训练知识为网上通用，缺少政府和企业内部知识，不懂业务，无法解决实际问题  闭源模型云端部署，使用过程中数据外传上网，存在泄密风险  闭源模型规模庞大，无法为企业进行定制，无法本地部署  成本高昂，一般企业难以负担 50政企、创业者必读  业务系统员工/岗位组织团队业务流程核心业务智能体企业要躬身入局，以自身业务驱动，打造专有智能体 63政企、创业者必读智能体在企业应用的七层能力与大模型直接聊天，输入简单提示词，无Agent能力具备简单GUI交互界面，可进行一些设置用内部提示词进行角色设定具备GUI界面的多个步骤的工具软件 L2 L1 L0 可执行复杂的规划、推理、分解、预测流程的工作流与企业业务流程、组织、系统打通

0 码力 | 76 页 | 5.02 MB | 6 月前
3
Deepseek R1 本地部署完全手册

部署步骤（Linux示例） 1. 安装依赖⼯具： # 安装llama.cpp（⽤于合并分⽚⽂件） /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" brew install llama.cpp 2. 下载并合并模型分⽚： 3. 安装Ollama： 4. 创建Modelfile：

0 码力 | 7 页 | 932.77 KB | 8 月前
3
国家人工智能产业综合标准化体系建设指南（2024版）

语言处理、智能语音、计算机视觉、生物特征识别、人机混合增强智能、智能体、群体智能、跨媒体智能、具身智能等标准。 1. 机器学习标准。规范机器学习的训练数据、数据预处理、模型表达和格式、模型效果评价等，包括自监督学习、无监督学习、半监督学习、深度学习、强化学习等标准。 2. 知识图谱标准。规范知识图谱的描述、构建、运维、共享、管理和应用，包括知识表示与建模、知识获取与存储、知识融合与可视化、知识计算与管理、知识图谱质量评价与互联互通、

0 码力 | 13 页 | 701.84 KB | 1 年前
3
DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model

美丽而又心灵手巧的姑娘，迈着纤纤细步款款而来，她挥舞剪刀，尽情地展示那高超的女工技巧，她先裁出了柳叶，随着柳条袅袅依依地舞蹈，又裁出杏叶，桃叶。该翻译所对应的古诗文是： OPTIONS - 春风骋巧如翦刀 - 剪裁无巧似春风 - 风吹怨恨快如刀 - 春风欲擅秋风巧 Table 17 | An example of CCPM. 38 PROMPT Q: 某小学在“献爱心–为汶川地震区捐款”活

0 码力 | 52 页 | 1.23 MB | 1 年前
3
DeepSeek从入门到精通(20250204)

自主设计验证路径并排查矛盾简单确认，缺乏深度推演 5. 执行需求需完成具体操作（代码/ 计算/流程）任务 + 步骤约束 + 输出格式自主优化步骤，兼顾效率与正确性严格按指令执行，无自主优化提示语示例决策需求验证性需求 "为降低物流成本，现有两种方案： ①自建区域仓库（初期投入高，长期成本低） ②与第三方合作（按需付费，灵活性高）请根据ROI计算模型，对比5年内的总成本并推荐最优

0 码力 | 104 页 | 5.37 MB | 8 月前
3

共 11 条前往

页

分类

语言

格式