DeepSeek从入门到精通(20250204)
发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 问题的每个步骤来得到答案 决策能力 依赖预设算法和规则进行决策 能够自主分析情况,实时做出决策 创造力 限于模式识别和优化,缺乏真正的创新能力 能够生成新的创意和解决方案,具备创新能力 人机互动能力 按照预设脚本响应,较难理解人类情感和意图 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板(如要求分 步思考、提供示例)。 关键原则 3 2 1 模型选择 • 优先根据任务类型而非模型热度选择(如数学任务选推理模型,创意任务选通用 模型)。 提示语设计0 码力 | 104 页 | 5.37 MB | 7 月前3清华大学 DeepSeek 从入门到精通
发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 问题的每个步骤来得到答案 决策能力 依赖预设算法和规则进行决策 能够自主分析情况,实时做出决策 创造力 限于模式识别和优化,缺乏真正的创新能力 能够生成新的创意和解决方案,具备创新能力 人机互动能力 按照预设脚本响应,较难理解人类情感和意图 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板(如要求分 步思考、提供示例)。 关键原则 3 2 1 模型选择 • 优先根据任务类型而非模型热度选择(如数学任务选推理模型,创意任务选通用 模型)。 提示语设计0 码力 | 103 页 | 5.40 MB | 8 月前3清华大学 普通人如何抓住DeepSeek红利
结构、内部系统以及行业情况。然而,公司的产品手册复杂,部门间的职责不清晰,内部系统操作繁琐,行业信 息量庞大,这些都让小李感到不知所措。他担心自己无法在短时间内快速上手,影响工作效率和表现。 以往的解决方式: • 依赖同事的口头介绍,容易遗漏重要信 息。 • 手动查阅厚重的产品手册和内部文档, 耗时较长。 • 参加多部门的培训,但信息量大,难以 消化。 • 通过网络搜索行业信息,但信息分散, 难以整合。 信息的准确性和全面性更高,减少了因信息不全而导致 的误解和错误。通过DeepSeek的数据分析功能,新员 工可以更深入地理解行业动态和公司运营,做出更明智 的决策。 成本更低: 减少了对培训资源的依赖,新员工可以通过DeepSeek 自主学习,降低培训成本。通过提高工作效率,减少了 人力资源的浪费,降低了整体运营成本。 场景3:日常客户沟通与问题反馈处理 常见问题: 与甲方客户的沟通效率低,信息不对称,导致响应不及时或错误 体系化 方案不可行 Python验算 无符合数字 有符合数字 如何使用DeepSeek处理生活中的事务 “生活太累?DeepSeek帮你‘减负’到家! 场景1:职场妈妈的晨间战役(日常琐事管理) 优先级排序(幼儿园事务>会议准备>生活采购) 生成最优动线:地图标注幼儿园/干洗店/超市与公司的位置关系 即时服务对接: ✓ 调用社区跑腿API下单手工材料配送 ✓ 接入干洗店智能柜系统预约取件码0 码力 | 65 页 | 4.47 MB | 7 月前3人工智能安全治理框架 1.0
对 措施。关注安全风险发展变化,快速动态精准调整治理措施,持续优化治理机 制和方式,对确需政府监管事项及时予以响应。 1.3 技管结合、协同应对。面向人工智能研发应用全过程,综合运用技术、 管理相结合的安全治理措施,防范应对不同类型安全风险。围绕人工智能研发 应用生态链,明确模型算法研发者、服务提供者、使用者等相关主体的安全责 任,有机发挥政府监管、行业自律、社会监督等治理机制作用。 共享最佳实践,提倡建立开放性平台,通过跨学科、跨领域、跨地区、跨国界 的对话和合作,推动形成具有广泛共识的全球人工智能治理体系。 2. 人工智能安全治理框架构成 基于风险管理理念,本框架针对不同类型的人工智能安全风险,从技术、 管理两方面提出防范应对措施。同时,目前人工智能研发应用仍在快速发展, 安全风险的表现形式、影响程度、认识感知亦随之变化,防范应对措施也将相 应动态调整更新,需要各方共同对治理框架持续优化完善。 的标准接口、特性库和工具包,以及开发界面和执行平台可能存在逻辑缺陷、- 5 - 人工智能安全治理框架 漏洞等脆弱点,还可能被恶意植入后门,存在被触发和攻击利用的风险。 (b)算力安全风险。人工智能训练运行所依赖的算力基础设施,涉及多源、 泛在算力节点,不同类型计算资源,面临算力资源恶意消耗、算力层面风险跨 边界传递等风险。 (c)供应链安全风险。人工智能产业链呈现高度全球化分工协作格局。 但个别国0 码力 | 20 页 | 3.79 MB | 28 天前3DeepSeek图解10页PDF
脑配置要求降 到最低,普通电脑也能飞速运行。 1.2 DeepSeek 本地部署三个步骤 一共只需要三步,就能做到 DeepSeek 在本地运行并与它对话。 第一步,使用的是 ollama 管理各种不同大模型,ollama 比较直接、干净, 一键下载后安装就行,安装过程基本都是下一步。 不知道去哪里下载的,可以直接在我的公众号后台回复:ollama,下载这个 软件,然后装上,可以拿着手机扫码下图1直达我的公众号: 知识,严禁拿此资料引流、出书、等形式的商业活动 图 1: 我的公众号:郭震 AI 安装后,打开命令窗口,输入 ollama,然后就能看到它的相关指令,一共 10 个左右的命令,如下图2所示,就能帮我们管理好不同大模型: 图 2: Ollama 常用的命令 第二步,命令窗口输入:ollama pull deepseek-r1:1.5b,下载大模型 deepseek- r1 到我们自己的电脑,如下图3所示: 就是自然语言处理领域实现扩展规律的最好的网络结构。 2.2 Transformer 基础架构 LLM 依赖于 2017 年 Google 提出的 Transformer 模型,该架构相比传统的 RNN(递归神经网络)和 LSTM(长短时记忆网络)具有更高的训练效率和 更强的长距离依赖建模能力。Transformer 由多个关键组件组成:1. 自注意 力机制(Self-Attention)0 码力 | 11 页 | 2.64 MB | 7 月前3清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单
案、法律意见书等,提高律师工作效率。 • 智能医疗数据分析与诊断:构建智能医疗 平台,分析病历、检查报告和基因数据,帮助 医生提供更准确的诊断与治疗方案。 • 金融风险预测与管理:开发金融风险分析 工具,收集并分析市场数据,预测风险并为金 融机构提供管理建议。 • 智能文学创作辅助:为作家提供创作灵感 和文本构思,生成符合中文文学传统的故事情 节和诗句,助力突破创作瓶颈。 • 智能广告创意生成:根据产品特点和目标 高频交易数据分析:利用o3mini快速处理 高频交易数据,识别市场趋势和交易模式,为 交易者提供实时决策支持。 • 数据报告自动化生成:基于o3mini自动 生成格式化的数据报告,包括图表、表格和文 字说明,帮助管理者快速理解分析结果。 • 数据接口标准化:根据标准格式输出数据, 利用o3mini方便不同系统和平台之间的数据 共享,提升跨机构协作效率。 • 情感分析与数据解读:利用o3mini结合 情感分析,对数据进行深入解读,帮助市场调 转化文献为连贯文章:可以将现有的文献资料进行分析 和整合,转化为逻辑连贯的新文章,为学者和知识工作 者提供了极大的便利。 多智能体协作对话:Co-STORM模式引入了协作对话 机制,并采用轮次管理策略,实现流畅的协作式AI学术 研究。 用户体验对比:使用步骤 PubScholar平台官网:https://pubscholar.cn/ 输入关键词:进入官网后,在搜索框键入关键词进行文献检索。0 码力 | 85 页 | 8.31 MB | 7 月前3开源中国 2023 大模型(LLM)技术报告
提供高效的存储和检索能力。通过数据向量化,实现了 在向量数据库中进行高效的相似性计算和查询。 根据向量数据库的的实现方式,可以将向量数据库大致分为两类: 原生的向量数据库专门为存储和检索向量而设计, 所管理的数据是基于对象或数据点的向量表示进行 组织和索引。 包括 等均属于原生向量数据库。 除了选择专业的向量数据库,对传统数据库添加 “向量支持”也是主流方案。比如 等传 统数据库均已支持向量检索。 基础设施:大模型框架及微调 (Fine Tuning) 大模型框架指专门设计用于构建、训练和部署大型机器 学习模型和深度学习模型的软件框架。这些框架提供了 必要的工具和库,使开发者能够更容易地处理大量的数 据、管理巨大的网络参数量,并有效地利用硬件资源。 微调(Fine Tuning)是在大模型框架基础上进行的一个 关键步骤。在模型经过初步的大规模预训练后,微调是 用较小、特定领域的数据集对模型进行后续训练,以使 / 32 大模型应用现状:首批备案上线的中国大模型 8 月 31 日,百度、字节、商汤、中科院旗下 紫东太初、百川智能、智谱华章等 8 家企业 / 机构的大模型产品首批通过《生成式人工智能 服务管理暂行办法》备案,可正式上线面向公 众提供服务。 具体包括:百度(文心一言)、抖音(云雀大 模型)、智谱 AI(GLM 大模型)、中科院 (紫东太初大模型)、百川智能(百川大模 型)、商汤(日日新大模型)、MiniMax0 码力 | 32 页 | 13.09 MB | 1 年前3国家人工智能产业综合标准化体系建设指南(2024版)
、安 全/治理等 7 个部分组成,如图 2 所示。 5 图 2 人工智能标准体系框架图 6 四、重点方向 (一)基础共性标准 基础共性标准主要包括人工智能术语、参考架构、测试评估、 管理、可持续等标准。 1. 术语标准。规范人工智能相关技术、应用的概念定义, 为其它标准的制定和人工智能研究提供参考,包括人工智能相关 术语定义、范畴、实例等标准。 2. 参考架构标准。规范人工智能相关技术、应用及系统的 方面的测试及评估的指标要求,包括与人工智能相关的服务能力 成熟度评估,人工智能通用性测试指南、评估原则和等级要求, 企业智能化能力框架及测评要求等标准。 4. 管理标准。规范人工智能技术、产品、系统、服务等全 生命周期涉及的人员、组织管理要求和评价,包括面向人工智能 组织的管理要求,人工智能管理体系、分类方法、评级流程等标 准。 5. 可持续标准。规范人工智能影响环境的技术框架、方法 和指标,平衡产业发展与环境保护,包括促进生态可持续的人工 模型表达和格式、模型效果评价等,包括自监督学习、无监督学 习、半监督学习、深度学习、强化学习等标准。 2. 知识图谱标准。规范知识图谱的描述、构建、运维、共 享、管理和应用,包括知识表示与建模、知识获取与存储、知识 融合与可视化、知识计算与管理、知识图谱质量评价与互联互通、 9 知识图谱交付与应用、知识图谱系统架构与性能要求等标准。 3. 大模型标准。规范大模型训练、推理、部署等环节的技 术0 码力 | 13 页 | 701.84 KB | 1 年前3【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502
多轮对话 图像生成 视频生成 音频生成 A I 数字人 生物制药 新材料研究 脑机接口 基础科学 能源自由 宇宙探索 生命科学 科学 能力 6 AI Fo r Science 知识管理( 内部知识管理、 外部情报分析、 大数据分析、 工作流知识) 专家经验模型( 专业模型训练) 业务流程自动化( A g e n t框架) 组织协同( 工作流) 人机交互 赋能个人和 企业员工 生产力提升 不能处理复杂流程,无法下地干活儿 通用大模型不了解企业内部业务情况、行业情况 58政企、创业者必读 知识管理是大模型更 懂企业的基础 59 解决企业应用,需要打造专业大模型 要解决四个关键基础 以业务大模型为基础, 打造自主工作的数字 员工和AI团队 实现多个Agent、多个 数字化系统、多个组织 之间的协同 知识 管理 融合 工作流 业务大模型 打造 构建 智能体 基于政府企业场景和专业 多模态数据处理和理解 非结构化文档处理和理解 搜索,辅助内部办公和外部客户服务 为业务大模型RAG做准备 内部知识管理 • 把企业内部的碎片化知识, 把专 家头脑中的经验转化为显性知识 管理起来, 如员工邮件、 文档文 件、 聊天记录、 工作记录等 工作流知识管理 1 外部情报分析 • 抓取外部情报, 例如行业报告、 市 场情报等 2 多模态处理 • 用大模型多模态能力把非结构化0 码力 | 76 页 | 5.02 MB | 5 月前3TVM工具组
caffe 前端有利于提高竞争力。 开源社区 存量的开源 caffe 网络模型众多,TVM 直接支持 caffe 让大家更方便尝试 caffe 资源。绝赞招聘中 当前进度 无 caffe 依赖 from_caffe 直接导入 caffe 模型文件,不需要预先安装 caffe 。 net 已测试网络:alexnet / densenet121 / inception v1 / inception0 码力 | 6 页 | 326.80 KB | 5 月前3
共 14 条
- 1
- 2