DeepSeek从入门到精通(20250204)因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板(如要求分 步思考、提供示例)。 关键原则 3 2 1 模型选择 • 优先根据任务类型而非模型热 冗余拆解(如“先画图,再列公式”) 通用模型 显式要求分步思考,提供示例 “请分三步推导勾股定理,参考: 1. 画直角三角形…” 直接提问(易跳过关键步骤) 创意写作 推理模型 鼓励发散性,设定角色/风格 “以海明威的风格写一个冒险故事” 过度约束逻辑(如“按时间顺序列出”) 通用模型 需明确约束目标,避免自由发挥 “写一个包含‘量子’和‘沙漠’ 的短篇小说,不超过200字” 开放式指令(如“自由创作”) 代码生成0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板(如要求分 步思考、提供示例)。 关键原则 3 2 1 模型选择 • 优先根据任务类型而非模型热 冗余拆解(如“先画图,再列公式”) 通用模型 显式要求分步思考,提供示例 “请分三步推导勾股定理,参考: 1. 画直角三角形…” 直接提问(易跳过关键步骤) 创意写作 推理模型 鼓励发散性,设定角色/风格 “以海明威的风格写一个冒险故事” 过度约束逻辑(如“按时间顺序列出”) 通用模型 需明确约束目标,避免自由发挥 “写一个包含‘量子’和‘沙漠’ 的短篇小说,不超过200字” 开放式指令(如“自由创作”) 代码生成0 码力 | 103 页 | 5.40 MB | 9 月前3
开源中国 2023 大模型(LLM)技术报告Agent 备案上线的中国大模型 知名大模型 知名大模型应用 大模型 算力 工具和平台 LLMOps 大模型聚合平台 开发工具 AI 编程 插件、IDE、终端 代码生成工具 编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心,随着大规模语言数据集的可用性和计算能 力的提升,研究者们开 (Fine Tuning) 大模型框架提供基本能力和普适性,而微调 则是实现特定应用和优化性能的关键环节 大模型训练平台&工具 提供了在不同硬件和环境中训练大语言模型 所需的基础设施和支持 编程语言 以 Python 为代表 5 / 32 LLM 基础设施:向量数据库/数据库向量支持 向量数据库是专门用于存储和检索向量数据的数据库,它可以为 LLM 提供高效的存储和检索能力。通过数据向量化,实现了 架构图 (图源:https://www.geeksforgeeks.org/architecture-of- tensorflow/) 12 / 32 LLM 基础设施:编程语言 LLM 的训练和应用通常使用多种编程语言,取决于任务的需求和团 队的偏好。 。它的广泛使用得 益于其简洁的语法、强大的库支持(如 )和深度学习框架(如 )。 此外, ,C++ 有时 用于优化计算密集型任务,而0 码力 | 32 页 | 13.09 MB | 1 年前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单免费课程和实验资源,促进AI教育普及。 • 智能编程教育助手:为编程学生提供实 时编程指导,自动生成代码示例,帮助解决 编程难题。 • 自动化代码审查工具:自动审查代码, 发现潜在问题并提供优化建议,提升开发效 率与代码质量。 新思路:Open AI o3mini的数据应用 推 理 响 应 速 度 快 写 作 情 感 表 达 能 力 格 式 化 输 出 能 力 数 据 分 析 效 率 规划中,o3mini有助于将不同来源的数据 (如交通流量、气象数据等)进行融合分析, 预测交通拥堵,为城市规划提供决策支持。 • 交互式数据可视化:在商业智能和数据 分析领域,o3mini可以将多维数据以可视化 的方式呈现,并支持用户进行交互式分析。 • 实时数据可视化与预警:在实时监控和 数据分析中,o3mini可以实时将数据以可视 化的方式展示,并支持用户与数据进行交互。 二 元知AI综述工具 元知是国内由清华、北航专家团队研发的一个AI学术平台,目前其AI综述生成工具已开放使用,能够帮助用户从海 量文献中提取核心信息,通过自然语言处理算法,实现从文献梳理到观点提取到研究评论的一键式全自动生成。 产品 概况 功能亮点 功能亮点 多版本与模块化支持:目前提供三个版本(基础版、增 强版、专业版),能够灵活应对不同用户的综述需求。 工具内包括文献观点梳理、问题提出等功能模块,确保0 码力 | 85 页 | 8.31 MB | 8 月前3
普通人学AI指南. . . . . . . . . 9 2.3.9 EBSynth . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4 AI 编程工具 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4.1 DEvv . . . . . . . . . . . 工具太多,种类太多,老的还没用,新的就出来,头大得 很!有没有这种感觉?所以,在这一章,梳理主流的 AI 工具,注意不是穷举, 那些不经常用的工具,不浪费文字和耽误时间。 梳理总结六大类 AI 工具,分别包括:问答,图像,视频,AI 编程,AI 提 示词和 AI 大模型,一共梳理挑选共计 38 个 AI 工具,其中很多都是开源! 2.1 问答 2.1.1 ChatGPT ChatGPT 是一个由 OpenAI 开发的大型语言模型,它基于 Pika 闭源的图像编辑工具,专注于简化图像处理流程。 2.3.4 腾讯智影 腾讯推出的 AI 视频编辑工具,支持视频内容的智能编辑和增强。 2.3.5 度加创作工具 度加创作工具是百度开发的一站式 AI 内容生成平台,支持视频制作、文案生成 和数字人模型等功能。 2.3.6 Spike Studio 智能长剪短:一个专为商业视频制作设计的工具,可以将长视频智能剪辑为短 视频。 2.3.70 码力 | 42 页 | 8.39 MB | 8 月前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502AI 从基于小参数模型的感知型AI,走向基于大参数模型的认知型AI 从擅长理解的认知型AI,发展到擅长文字生成的生成式AI 从语言生成式AI,发展到可理解和生成声音、图片、视频的多模态AI 从生成式AI,发展到推理型AI 专家系统 感知AI 认知AI 生成式AI 多模态AI 推理式AI 9政企、创业者必读 人工智能发展历程(二) 从单纯对话的大模型AI,发展到具有行动和执行能力的智能体AI 大模型安全之战 • 探索超越人类的超级人工 智能AGI • 不仅是科技之争,更是国 运之争 • 不发展是最大的不安全, 发挥举国体制优势,打赢 追赶之战 • 大模型带来前所未有安全 挑战 • 外挂式传统安全手段难以 应对 • 应对模型安全新挑战,打 赢未雨绸缪之战 • 大模型是能力而非产品, 结合场景才能发挥价值 • 中国拥有最完整的产业链、 最全的工业门类、最丰富 的场景 • 发挥场景优势,加速传统 而DeepSeek的创新更具颠覆性 24政企、创业者必读 DeepSeek是完美的颠覆式创新 技术创新——让过去做不到的事情可以做到 体验创新——让使用起来很难很复杂的东西变得很简单易用 市场推广创新——让过去很难得到的东西可以得到 商业模式创新——让过去很昂贵的东西变得很便宜甚至免费 DeepSeek正是符合这四种创新模式的完美例子 25 颠覆式创新的四种方式政企、创业者必读 DeepSeek-R1突破了大模型Scaling0 码力 | 76 页 | 5.02 MB | 6 月前3
清华大学 普通人如何抓住DeepSeek红利• DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正 式版。 • DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大 提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAl-o1正式版。 (Pass@1) 让AI用类比解释: “请用‘水管流速’比喻说明隐函数求导中dy/dx的意 义。” Ø 生成记忆口诀: “把隐函数求导步骤编成顺口溜,包含‘遇y先写 dy/dx’等关键词。” 场景2:文科生快速上手编程 加载数据集:使用datasets库加载SQuAD数据集,这个数据 集包含了大量基于2020年之前数据生成的问答对。 提取问题:从数据集中提取问题,并使用set去重。 检查问题数量:确保提取的问题数量至少为10万个。 提示语更简洁, 只需明确任务目标和 需求(因其已内化推理逻辑) 。 • 无需逐步指导, 模型自动生成结构化 推理过程(若强行拆解步骤, 反而可 能限制其能力) 。 • 需显式引导推理步骤(如通过CoT提 示) , 否则可能跳过关键逻辑 。 • 依赖提示语补偿能力短板(如要求分 步思考 、提供示例) 。 策略类型 定义与目标 适用场景 示例(推理模型适用) 优势与风险0 码力 | 65 页 | 4.47 MB | 8 月前3
国家人工智能产业综合标准化体系建设指南(2024版)基础数据服务标准。规范人工智能研发、测试、应用等 过程中涉及数据服务的要求,包括数据采集、数据标注、数据治 理、数据质量等标准。 2. 智能芯片标准。规范智能芯片相关的通用技术要求,包 括智能芯片架构、指令集、统一编程接口及相关测试要求、芯片 数据格式和协议等标准。 3. 智能传感器标准。规范单模态、多模态新型传感器的接 口协议、性能评定、试验方法等技术要求,包括智能传感器的架 构、指令、数据格式、信息提取方法、信息融合方法、功能集成 神经网 络模型表达和压缩等标准。 8. 软硬件协同标准。规范智能芯片、计算设备等硬件与系 统软件、开发框架等软件之间的适配要求,包括智能芯片与开发 框架的适配要求、人工智能计算任务调度、分布式计算等软硬件 协同任务的交互协议、执行效率和协同性能等标准。 (三)关键技术标准 关键技术标准主要包括机器学习、知识图谱、大模型、自然 语言处理、智能语音、计算机视觉、生物特征识别、人机混合增 智能体标准。规范以通用大模型为核心的智能体实例和 10 智能体基本功能、应用架构等技术要求,包括智能体强化学习、 多任务分解、推理、提示词工程,智能体数据接口和参数范围, 人机协作、智能体自主操作、多智能体分布式一致性等标准。 10. 群体智能标准。规范群体智能算法的控制、编队、感知、 规划、决策、通信等技术要求和评测方法,包括自主控制、协同 控制、任务规划、路径规划、协同决策、组网通信等标准。 110 码力 | 13 页 | 701.84 KB | 1 年前3
清华大学第二弹:DeepSeek赋能职场2021全球人工智能技术创新大赛-小布助手对话短文本语义匹配 一等奖 2022全球人工智能技术创新大赛-商品标题实体识别 一等奖 第十八届中国计算语言学大会-小牛杯中文幽默计算 一等奖 第十届全国社会媒体处理大会-中文隐式情感分析 一等奖 2021全球开放数据应用创新大赛-基于文本挖掘的企业隐患排查质量分析模型 第一名 2021中国计算机学会大数据与计算智能大赛-“千言〞 问题匹配鲁棒性评测 第一名 2021年全 DeepSeek 三种模式对比 • 基础模型(V3):通用模型(2024.12),高效便捷,适用于绝大多数任务,“ ”任务 • 深度思考(R1):推理模型,复杂推理和深度分析任务,如数理逻辑推理和编程代码,“ ”任务 • 联网搜索:RAG(检索增强生成),知识库更新至 DeepSeek 两种模型对比 操作规范清晰 且对结果有明确要求 操作路径多元、开放, 且对结果没有明确要求 DeepSeek0 码力 | 35 页 | 9.78 MB | 8 月前3
DeepSeek图解10页PDF4: Ollama 软件启动 deepseek-r1 界面 1.3 DeepSeek 本地运行使用演示 基于上面步骤搭建完成后,接下来提问 DeepSeek 一个问题:请帮我分析 Python 编程如何从零开始学习?,下面是它的回答,首先会有一个 think 标签,这里面嵌入的是它的思考过程,不是正式的回复: 图 5: deepseek-r1 回复之思考部分 等我们看到另一个结束标签 think0 码力 | 11 页 | 2.64 MB | 8 月前3
共 11 条
- 1
- 2













