两阶段导入 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

然语言处理任务，如对话生成和文本理解。爬虫数据采集 1、阅读网页源代码，提取特定网页内容； 2、撰写python脚本； 3、提取并合并网址； 4、提取网址内容； 5、写入文件。任务你需要完成以下两个任务： 1.阅读网页【网址】源代码【对应网页源代码】。提取所有包含“春运2025丨X月X日，全社会跨区域人员流动量完成X万人次”的网址进行去重、筛选，合并成网址列表 2.撰写python脚本，基于步骤1输出的网址列表提取所有网能够精准分析关键指标生存率，但对特征提取不完整，仅能识别较为浅层的数据关联，分析能力相对较弱。  DeepSeek R1与Open AI o3mini的数据分析能力相当，且领先其他两个模型，均能够精准抓取数据核心指标并做统计，找到各特征与核心指标的关联，其中R1分析逻辑更加清晰严谨，而o3推理更加高效；  Kimi k1.5推理逻辑清晰但分析能力相对较弱， Claude 3 撰写文章标题指令指令：我想让您担任学术期刊编辑，我将向您提供一份手稿摘要，您将向我提供 5 个好的研究论文英文标题，并解释为什么这个标题是好的。请将输出结果以 Markdown 表格的形式提供，表格有两列，标题为中文。第一列给出英文标题，第二列给出中文解释。以下文本为摘要：【指令后加上文章的摘要】。中-英、英-中互译指令指令：我想让你充当一名科研类的英汉翻译，我会向你提供一种语言的一些

0 码力 | 85 页 | 8.31 MB | 8 月前
3
普通人学AI指南

技术可以生成如下类型的内容： • 图像：如照片、原创艺术作品 • 音频：如视频游戏中的配音、音乐 • 文本：如代码、广告文案、小说 • 3D 模型：如角色、场景目前，AIGC 技术处于早期阶段，最常见的产品形态是基于文本的，通过用户输入来控制内容的生成。用户输入文本描述所需的内容，然后模型输出与描述相符的内容。下图 1描述了 AI 大模型，AIGC 和 AGI 关系。 Figure 围。窗口越大，模型就能处理越长的上下文，对理解长文本内容非常重要。较大的窗口允许模型处理更长的文本片段，从而提高在长文本任务中的表现，如长篇对话、文档生成和分析等。 1.4.2 单位 B 和 T 在 AI 大模型中，常用的两个单位是 B 和 T。 B（十亿，Billion）：在英文里是 Billion 的缩写，表示十亿。对于 AI 大模型来说，B 一般用于描述模型的参数数量。例如，具有 50B 参数的模型代表这个模型有闭源：由一个小团队开发的闭源 AI，专注于生成创意和艺术图像。 2.3 AI 视频工具 Figure 5: AI 视频工具 2.3.1 Sora (OpenAI 公司) 内测：由 OpenAI 开发，目前处于内部测试阶段的项目。 8 2.3.2 Runway 闭源：一个闭源的创意工具，支持通过 AI 进行视频编辑和生成。 2.3.3 Pika 闭源的图像编辑工具，专注于简化图像处理流程。 2.3.4 腾讯智影

0 码力 | 42 页 | 8.39 MB | 8 月前
3
DeepSeek从入门到精通(20250204)

擅长解决结构化和定义明确的问题能够处理多维度和非结构化问题，提供创造性的解决方案伦理问题作为受控工具，几乎没有伦理问题引发自主性和控制问题的伦理讨论 CoT链式思维的出现将大模型分为了两类：“概率预测（快速反应）”模型和“链式推理（慢速思考）”模型。前者适合快速反馈，处理即时任务；后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合适的模型，实现最佳效果。提示语策略差异逻辑分析推理模型直接抛出复杂问题 “分析‘电车难题’中的功利主义与道德主义冲突” 添加主观引导（如“你认为哪种对？”）通用模型需拆分问题，逐步追问 “先解释电车难题的定义，再对比两种伦理观的差异” 一次性提问复杂逻辑如何向AI表达需求需求类型特点需求表达公式推理模型适配策略通用模型适配策略 1. 决策需求需权衡选项、评估风险、选择最优解目标 + 选项需完成具体操作（代码/ 计算/流程）任务 + 步骤约束 + 输出格式自主优化步骤，兼顾效率与正确性严格按指令执行，无自主优化提示语示例决策需求验证性需求 "为降低物流成本，现有两种方案： ①自建区域仓库（初期投入高，长期成本低） ②与第三方合作（按需付费，灵活性高）请根据ROI计算模型，对比5年内的总成本并推荐最优解。" �实战技巧： "以下是

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

擅长解决结构化和定义明确的问题能够处理多维度和非结构化问题，提供创造性的解决方案伦理问题作为受控工具，几乎没有伦理问题引发自主性和控制问题的伦理讨论 CoT链式思维的出现将大模型分为了两类：“概率预测（快速反应）”模型和“链式推理（慢速思考）”模型。前者适合快速反馈，处理即时任务；后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合适的模型，实现最佳效果。提示语策略差异逻辑分析推理模型直接抛出复杂问题 “分析‘电车难题’中的功利主义与道德主义冲突” 添加主观引导（如“你认为哪种对？”）通用模型需拆分问题，逐步追问 “先解释电车难题的定义，再对比两种伦理观的差异” 一次性提问复杂逻辑如何向AI表达需求需求类型特点需求表达公式推理模型适配策略通用模型适配策略 1. 决策需求需权衡选项、评估风险、选择最优解目标 + 选项需完成具体操作（代码/ 计算/流程）任务 + 步骤约束 + 输出格式自主优化步骤，兼顾效率与正确性严格按指令执行，无自主优化提示语示例决策需求验证性需求 "为降低物流成本，现有两种方案： ①自建区域仓库（初期投入高，长期成本低） ②与第三方合作（按需付费，灵活性高）请根据ROI计算模型，对比5年内的总成本并推荐最优解。" �实战技巧： "以下是

0 码力 | 103 页 | 5.40 MB | 8 月前
3
TVM工具组

客户需求评估阶段：客户用于评估芯片的网络，caffe 模型占很大比重。竞品已支持 caffe 前端当前各大芯片厂商的部署工具大多数都支持，支持 caffe 前端有利于提高竞争力。开源社区存量的开源 caffe 网络模型众多，TVM 直接支持 caffe 让大家更方便尝试 caffe 资源。绝赞招聘中当前进度无 caffe 依赖 from_caffe 直接导入 caffe 模型文件，不需要预先安装

0 码力 | 6 页 | 326.80 KB | 5 月前
3
清华大学普通人如何抓住DeepSeek红利

发展的持续动力。善用DeepSeek的两大关键：提出问题鉴别答案 DeepSeek是什么? • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正式版。 • DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大场景1：1小时内写完一个1万字的项目书是否可用DeepSeek（深度求索）辅助处理？可以，但需分阶段“榨干AI效率”，核心策略：框架复制+模块填充+数据嫁接。分步解决方案：第一阶段：5分钟——用AI暴力生成框架（目标：3000字）场景1：1小时内写完一个1万字的项目书第二阶段：20分钟——用AI批量填充模块（目标：6000字）针对每个小节单独提问，例如： “写一段‘2.1 用表格展示。” p 模板复制：对同类章节（如3.1/3.2/3.3）使用相同指令模板，仅替换关键词。 p 强制格式：要求AI输出带编号小标题、分点、表格的内容，直接粘贴后即显“专业感”。第三阶段：20分钟——用AI补全软性内容（目标：1000字）填充“虚但必需”的部分： p 政策背书： “生成5条2023年国家层面支持智能物流园区的政策原文（带发文号），并解读对本案的指导意义。”

0 码力 | 65 页 | 4.47 MB | 8 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

DeepSeek-R1 探索出RL方法，且公开技术 • 诞生推理型Scaling Law DeepSeek颠覆式创新——技术创新 29政企、创业者必读技术上实现对美国的赶超掌握通向AI下一阶段的方法论 DeepSeek颠覆式创新——技术创新  美国人仍在遵循预训练Scaling law范式，走堆显卡路线，如 “星际之门”计划  中国DeepSeek-R1的创新突破，诞生推理型Scaling DeepSeek六大应用方向之五科学研究：打造科研新范式 44政企、创业者必读 AI For Science，为基础科学带来革命性变化 2024诺贝尔化学奖颁发给研发AlphaFold的两位AI专家未来所有科学研究都将以AI为中心过去如何做蛋白质研究 AlphaFold 1. X射线晶体衍射 2. 核磁共振 3. 冷冻电子显微镜 1. 利用Transformer的预测能力， DeepSeek+场景+智能体+知识库 66政企、创业者必读 67 企业应用AI的经验总结政企、创业者必读建立AI信仰、培养AI素养才能真正拥抱AI时代 68政企、创业者必读个人AI能力的五个阶段只会与大模型进行聊天（纳米AI）能打造个人专业知识库，具备知识收集和整理能力（纳米AI知识库）能使用常见的AI工具，能使用别人打造的智能体（纳米AI工具）能搭建简单的智能体，能打造自己的工具和数字助手（纳米AI智能体）

0 码力 | 76 页 | 5.02 MB | 5 月前
3
DeepSeek图解10页PDF

主要亮点在于出色的数学和逻辑推理能力，区别于一般的通用 AI 模型。其训练方式结合了强化学习（RL）与监督微调（SFT），创造了一种高效训练，高推理能力 AI 模型的方法。整个训练过程分为核心两阶段，第一步训练基于 DeepSeek-V3 论文中的基础模型（而非最终版本），并经历了 SFT 和基于纯强化学习调优 + 通用性教程作者：郭震，工作 8 年目前美国 AI 博士在读，公众号：郭震 DeepSeek-R1-Zero R1-Zero 能生成高质量的推理数据，包括大量长链式思维（Chain-of-Thought, CoT）示例，用于支持后续的 SFT 阶段，如图7所示。更加详细介绍参考3.2节。 3.1.2 核心创新 2：通用强化学习第一阶段 R1-Zero 虽然展现出惊人的推理能力提升，但是也出现了回复时语言混合，非推理任务回复效果差的问题，为了解决这些问题，DeepSeek 提出通用强化学习训练框架。活动通用任务上的表现。更加详细介绍参考3.3节。 3.2 含 R1-Zero 的中间推理模型训练过程中间模型占据主要训练精力的阶段，实际上完全通过推理导向的强化学习直接训练而成，完全跳过了监督微调（SFT），如下图8所示，只在强化学习的冷启动阶段使用了 SFT。图 8: Interim reasoning model 训练方法大规模推理导向的强化学习训练，必不可少的就是推理数据，手动标注就

0 码力 | 11 页 | 2.64 MB | 8 月前
3
开源中国 2023 大模型(LLM)技术报告

向量数据库是专门用于存储和检索向量数据的数据库，它可以为 LLM 提供高效的存储和检索能力。通过数据向量化，实现了在向量数据库中进行高效的相似性计算和查询。根据向量数据库的的实现方式,可以将向量数据库大致分为两类：原生的向量数据库专门为存储和检索向量而设计，所管理的数据是基于对象或数据点的向量表示进行组织和索引。包括等均属于原生向量数据库。除了选择专业的向量数据库，对传统数据库添加 “向量支持”也是主流方案。比如 6 / 32 LLM 基础设施：向量数据库/数据库向量支持自 2022 年 ChatGPT 问世以来，大模型星火初始，向量数据库不但获得了技术领域的关注，也逐渐吸引了市场和资本的注意力。近两年来，向量数据库公司迎来了一波融资潮：  Pinecone：已融资  Zilliz：已融资  Weaviate：已融资  Vespa：已融资  Chroma：已融资  Qdrant：已融资其更好地适应特定的任务或应用场景。这一步骤使得通用的大型模型能够在特定任务上表现出更高的精度和更好的效果。大模型框架提供了 LLM 的基本能力和普适性，而微调则是实现特定应用和优化性能的关键环节。两者相结合，使得 LLM 在广泛的应用场景中都能发挥出色的性能。 8 / 32 LLM 基础设施：大模型框架及微调 (Fine Tuning) 大模型框架有哪些特点：：大模型开发框架通过提供高

0 码力 | 32 页 | 13.09 MB | 1 年前
3
清华大学第二弹：DeepSeek赋能职场

深度思考（R1）：推理模型，复杂推理和深度分析任务，如数理逻辑推理和编程代码，“ ”任务 • 联网搜索：RAG（检索增强生成），知识库更新至 DeepSeek 两种模型对比操作规范清晰且对结果有明确要求操作路径多元、开放，且对结果没有明确要求 DeepSeek 两种模型对比（5R）维度 V3模型 R1模型 Regulation （规范性）强规范约束（操作路径明确）弱规范约束（操作路径开放）（按规则执行）主动创新（自主决策） Risk （风险特征）低风险（稳定可控）高风险（不确定性高）（限定于文本生成任务） DeepSeek 两种模型对比 V3 R1 DeepSeek 两种模型对比 V3 R1 如何提问？两种模型的提示语差异 • 基础模型（V3）：“过程-结果”清晰（指令） • 深度思考（R1）：目标清晰，结果可以模糊（推理） RTGO提示语结构

0 码力 | 35 页 | 9.78 MB | 8 月前
3

共 13 条前往

页

分类

语言

格式