DeepSeek从入门到精通(20250204),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 问题的每个步骤来得到答案 能够处理多维度和非结构化问题,提供创造性的解 决方案 伦理问题 作为受控工具,几乎没有伦理问题 引发自主性和控制问题的伦理讨论 CoT链式思维的出现将大模型分为了两类:“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 适的模型,实现最佳效果。 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 问题,需分步验证结果)。 从“下达指令”到“表达需求” 策略类型 定义与目标 适用场景 示例(推理模型适用) 优势与风险 指令驱动 直接给出明确步骤或 格式要求 简单任务、需快速执行 “用Python编写快速排序函 数,输出需包含注释。” ✅ 结果精准高效 ❌ 限制模型自主优化空 间 需求导向 描述问题背景与目标, 由模型规划解决路径 复杂问题、需模型自主 推理 “我需要优化用户登录流程,0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通,主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 问题的每个步骤来得到答案 能够处理多维度和非结构化问题,提供创造性的解 决方案 伦理问题 作为受控工具,几乎没有伦理问题 引发自主性和控制问题的伦理讨论 CoT链式思维的出现将大模型分为了两类:“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 适的模型,实现最佳效果。 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 问题,需分步验证结果)。 从“下达指令”到“表达需求” 策略类型 定义与目标 适用场景 示例(推理模型适用) 优势与风险 指令驱动 直接给出明确步骤或 格式要求 简单任务、需快速执行 “用Python编写快速排序函 数,输出需包含注释。” ✅ 结果精准高效 ❌ 限制模型自主优化空 间 需求导向 描述问题背景与目标, 由模型规划解决路径 复杂问题、需模型自主 推理 “我需要优化用户登录流程,0 码力 | 103 页 | 5.40 MB | 8 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单长文本处理:擅长处理长文本 和复杂文档,适合专业场景。 定制化能力:支持用户自定义 训练和微调,适应特定需求。 Open AI o3 mini 小型化设计:轻量级模型, 适合资源有限的环境。 快速响应:优化推理速度, 适合实时交互场景。 通用性强:适用于多种自 然语言处理任务,如对话 生成和文本理解。 爬虫数据采集 1、阅读网页源代码,提取特定网页内容; 2、撰写python脚本; ,无法作为决策制定、质量评估或产品验证的最终依据。 文件数据读取 1、读取文件; 2、根据指定内容整理成表格。 任务 Open AI o3mini 暂不支持附件上传,响应速度 快,能够快速读取粘贴数据, 输出结果格式工整、简洁。 DeepSeek R1 能够详细全面地提取文件中的 数据,并整理成可视化数据表 格,逻辑性强、指标清晰。 所上传的“2025春运数据(1月14-2月8日) 策制定、质量评估或产品验证的最终依据。 文件数据读取 Claude 3.5 sonnet 很好地完成了数据读取及提取 任务,没有漏数据指标,数据 逻辑性很好 Kimi k1.5 能够快速读取文件数据,并 整理成可视化数据表格,但 填入数据有所缺失。 DeepSeek R1与Claude 3.5 sonnet均能很好的完成文件数据读取任务,生成的表格逻辑性强、数据指标清晰,Claude0 码力 | 85 页 | 8.31 MB | 8 月前3
开源中国 2023 大模型(LLM)技术报告等高性能计算硬件,以加速模型 的训练和推理过程。 :为了处理大型数据集和大规模参 数网络,这些框架通常设计得易于水平扩展, 支持在多个处理器或多个服务器上并行处理。 :它们提供工具来有效地加 载、处理和迭代大型数据集,这对于训练大 型模型尤为重要。 国产深度学习框架 OneFlow 架构 (图源:https://www.oneflow.org/a/chanpin/oneflow/) 9 / 32 与 知识共享,推动了自然语言处理技术的快速发展和广泛应用。 相比前边的大模型框架和微调,一言以蔽之: 、 11 / 32 LLM 基础设施:大模型训练平台与工具 大模型训练平台与工具根据其性质不同,可分为以下几类: 这些平台提供了从模型开发到部署的综合解决方案,包括计算资源、 数据存储、模型训练和部署服务。它们通常提供易于使用的界面,支 持快速迭代和大规模部署。Amazon SageMaker、Google (图源:https://www.nature.com/articles/d41586-023-03930-6) 19 / 32 大模型应用现状:知名大模型应用 20 / 32 AI 编程 生成式 AI 正经历前所未有的快速普及, 而开发者们正积极将 AI 作为自己的生 产力工具,随着众多 AI 编程工具的普 及,开发者们使用 AI 辅助工作已经逐 渐司空见惯。 分析公司 O’Reilly 日前发布一份 《2023 Generative0 码力 | 32 页 | 13.09 MB | 1 年前3
清华大学 普通人如何抓住DeepSeek红利放大、段落间距调宽,快速“膨胀”页数。 ü 若有时间,再精雕细琢 场景2:新员工快速熟悉公司情况和行业情况 场景:小李刚刚加入一家制造电子元器件的公司,作为一个新员工,他需要在短时间内熟悉公司的产品线、组织 结构、内部系统以及行业情况。然而,公司的产品手册复杂,部门间的职责不清晰,内部系统操作繁琐,行业信 息量庞大,这些都让小李感到不知所措。他担心自己无法在短时间内快速上手,影响工作效率和表现。 场景2:新员工快速熟悉公司情况和行业情况 快速了解行业情况和市场趋势 DeepSeek可以整合行业报告、市场分析、竞争对手信 息等数据,帮助新员工快速掌握行业动态。 操作步骤 上传行业报告、市场分析文档、竞争对手资料等到 DeepSeek。 使用搜索功能查询“电子元器件行业现状”、“未来发 展趋势”等关键词,生成简洁的分析报告。 优势 通过DeepSeek的数据分析功能,快速生成行业概览, 节省了手动整理的时间。 通过DeepSeek的多维度分析,深入了解行业的竞争格 局和市场机会。 效率更高: DeepSeek通过整合信息源和智能搜索,减少了手动查 找和整理的时间,新员工可以在短时间内快速上手。通 过自动化的信息检索和分析,新员工可以更快地掌握公 司和行业的关键信息。 效果更好: 信息的准确性和全面性更高,减少了因信息不全而导致 的误解和错误。通过DeepSeek的数据分析功能,新员0 码力 | 65 页 | 4.47 MB | 8 月前3
国家人工智能产业综合标准化体系建设指南(2024版)深度学习框架和工具,模型层主要是指大模型等技术和产 品,应用层主要是指人工智能技术在行业场景的应用。近年 来,我国人工智能产业在技术创新、产品创造和行业应用等 方面实现快速发展,形成庞大市场规模。伴随以大模型为代 2 表的新技术加速迭代,人工智能产业呈现出创新技术群体突 破、行业应用融合发展、国际合作深度协同等新特点,亟需 完善人工智能产业标准体系。 二、总体要求 以习近平新时代中国特色社会主义思想为指导,全面贯 坚持创新驱动。优化产业科技创新与标准化联动机制, 加快人工智能领域关键共性技术研究,推动先进适用的科技 创新成果高效转化成标准。 坚持应用牵引。坚持企业主体、市场导向,面向行业应 用需求,强化创新成果迭代和应用场景构建,协同推进人工 3 智能与重点行业融合应用。 坚持产业协同。加强人工智能全产业链标准化工作协 同,加强跨行业、跨领域标准化技术组织的协作,打造大中 小企业融通发展的标准化模式。0 码力 | 13 页 | 701.84 KB | 1 年前3
人工智能安全治理框架 1.0- 人工智能安全治理框架 1.2 风险导向、敏捷治理。密切跟踪人工智能研发及应用趋势,从人工 智能技术自身、人工智能应用两方面分析梳理安全风险,提出针对性防范应对 措施。关注安全风险发展变化,快速动态精准调整治理措施,持续优化治理机 制和方式,对确需政府监管事项及时予以响应。 1.3 技管结合、协同应对。面向人工智能研发应用全过程,综合运用技术、 管理相结合的安全治理措施,防范应对不同类型安全风险。围绕人工智能研发 的对话和合作,推动形成具有广泛共识的全球人工智能治理体系。 2. 人工智能安全治理框架构成 基于风险管理理念,本框架针对不同类型的人工智能安全风险,从技术、 管理两方面提出防范应对措施。同时,目前人工智能研发应用仍在快速发展, 安全风险的表现形式、影响程度、认识感知亦随之变化,防范应对措施也将相 应动态调整更新,需要各方共同对治理框架持续优化完善。 2.1 安全风险方面。通过分析人工智能技术特性,以及在不同行业领域 人工智能内生安全风险 3.1.1 模型算法安全风险 (a)可解释性差的风险。以深度学习为代表的人工智能算法内部运行逻 辑复杂,推理过程属黑灰盒模式,可能导致输出结果难以预测和确切归因,如 有异常难以快速修正和溯源追责。 (b)偏见、歧视风险。算法设计及训练过程中,个人偏见被有意、无意引入, 或者因训练数据集质量问题,导致算法设计目的、输出结果存在偏见或歧视, 甚至输出存在民族、宗教、国别、地域等歧视性内容。0 码力 | 20 页 | 3.79 MB | 1 月前3
普通人学AI指南智能体开发平台,支持创建和部署智能对话系统。 2.4.5 solo Mozilla 开源项目,提供零代码网站开发功能,易于使用。 2.4.6 Cursor 开源的 AI 代码编辑器,旨在通过 AI 技术助力快速软件开发。 2.4.7 Tabby 自托管的 AI 编程助手,开源,支持开发人员优化编码过程。 2.4.8 Codeium 开源的 AI 编程工具,用于自动化代码生成和优化。 2.4.9 GitHub 网址:https://tools.saxifrage.xyz/prompt,一个可视化工具,帮助用户为多 种 AI 模型生成和优化提示语。 2.5.6 Snack Prompt 提供最新 AI 模型提示词的工具,旨在快速获取和使用最新的 AI 提示进行内容 创作。 2.6 AI 大模型 2.6.1 AgentGPT 一个基于浏览器的自主 AI 工具,专为交互式任务和自动化操作设计。 2.6.2 GPT-4 是一个开源的容器化平台,旨在开发、部署和运行应用。它利用容器来 隔离软件,使其在不同环境中都能一致运行。Docker 提供轻量级虚拟化,能快 速部署并且易于管理应用。 Docker 的优势: 1. 快速部署:Docker 容器可以在几秒钟内启动,提高了开发和部署的效率。 2. 一致性:确保应用在开发、测试和生产环境中具有一致的运行环境。 3. 可移植性:容器可以在任何支持 Docker 的系统上运行,实现跨平台的可0 码力 | 42 页 | 8.39 MB | 8 月前3
清华大学第二弹:DeepSeek赋能职场PPT大纲辅助生成 功能: 根据用户提供的主题、内容要求、风格偏好,自动生成专业详实的PPT大纲(markdown),并针 对核心内容设计流程图(mermaid)。 技能: •资料收集能力:能够快速收集和分析相关主题的最新数据和报告,形成表 格,提取关键信息并转化为易于理解的PPT大纲。 •内容结构化:根据用户的需求,提供清晰、条理化的PPT结构,确保内容 流畅且富有逻辑。 •领域特定知识:掌 少于30页内容,内容一定要完整。 •确保所有信息的准确性和来源可靠性,尤其是行业数据和市场分析。 工作流程: 1.确认主题:询问用户的PPT主题,并了解用户的具体需求和内容重点。 2.收集资料:快速查找相关的研究报告、市场分析数据等,确保信息的最新 性和权威性,并将关键资料整理形成表格。 3.生成PPT大纲:根据用户需求和收集到的资料,构建PPT大纲,明确每一页 的内容和结构。要有每个章节的题 的沉浸感。背景可加入漂浮的全息广告牌、空中交通、赛博战士等元素。 8K超清画质,极致细节,梦幻灯光,未来感十足。 如何使用DeepSeek设计海报? 如何使用DeepSeek生成视频? 一款全流程智能化创作工具,专注于将创意构思快速转化为高品质的视频成片。实时生成多达50个分镜脚本,并智能搭配分镜图、视频及音乐提示词,确保创意风格与 情感统一。软件支持美学意象风格的短片创作,具备角色一致性技术,离线生成样片,同时实现分镜自动成0 码力 | 35 页 | 9.78 MB | 8 月前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502大模型进入「轻量化」时代,上车上终端,蒸馏小模型 先做得更大,然后探索能做多小政企、创业者必读 DeepSeek出现之前的十大预判 之五 知识的质量和密度决定大模型能力 高质量数据、合成数据使模型知识密度的快速增长 大模型能以更少的参数量达到更高的性能 360联合北大研发:5%参数量逼近Deepseek-R1满血性能 18政企、创业者必读 DeepSeek出现之前的十大预判 之六 成本越来越低 多模态越来越重要 由文本生成迈向图像、视频、3D内容与世界模拟 多模态模态在能力变强的同时,规模正在变小 20政企、创业者必读 21 DeepSeek出现之前的十大预判 之八 智能体推动大模型快速落地 能够调用各种工具,具有行动能力 调用企业专业知识,更懂企业 将日常重复性业务流程形成Playbook,实现流程自动化 通过目标拆解,多次调用大模型以及专家模型协同,形成 慢思考能力 开源效果追赶上闭源 技术开放,吸引广大开发人员和用户使用 很多公司参与开源,帮助改进产品,众人拾柴火焰高, 反哺开源产品,形成正循环政企、创业者必读 DeepSeek出现之前的十大预判 之十 中美差距快速缩小 美国预训练堆算力的路线不可持续,有待发现新范式“换道超车” 软件和算法差距并不大,主要差距在工程、硬件等方面 23政企、创业者必读 DeepSeek的出现验证了我们的预判 而DeepSeek的创新更具颠覆性0 码力 | 76 页 | 5.02 MB | 6 月前3
共 12 条
- 1
- 2













