清华大学 普通人如何抓住DeepSeek红利如何提问?让AI一次性生成你想要的东西 卷不动了?DeepSeek帮你一键“躺赢”! 学习太难?DeepSeek带你“开挂”逆袭! 生活太累?DeepSeek帮你“减负”到家! 社交障碍?DeepSeek教你“高情商”破局! ZXDWsPoPvNtNtNnQnPpMsP8O8QaQpNpPsQqNeRqQnPkPnMpM9PoOwOxNpNsPuOqQpN p 提示词驱动的新生产力 在AI时代,知识的获 记录、几份过时的模板,且对“智能物流”技术细节不熟。电 脑右下角显示时间:3:05 PM,你手心冒汗,疯狂翻找资料,但文档光标始终停留在标题页…… 场景1:1小时内写完一个1万字的项目书 是否可用DeepSeek(深度求索)辅助处理? 可以,但需分阶段“榨干AI效率”,核心策略:框架复制+模块填充+数据嫁接。 分步解决方案: 第一阶段:5分钟——用AI暴力生成框架(目标:3000字) 你需要请假3天回老家处理。你担心领导认为你“临阵脱逃”,也怕耽误项目进度,但家人需要你立刻回去。你 坐在工位上反复措辞,始终不敢敲开领导办公室的门。 场景4:项目中急需请假 如何开口 是否可用DeepSeek辅助处理?可以,且建议分三步使用: 1. 情绪梳理与沟通策略(用AI模拟对话) p 操作:向DeepSeek输入:“我要请假,但项目很紧急,领导可能不满,如何沟通?” p AI辅助:0 码力 | 65 页 | 4.47 MB | 8 月前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502,是新的生产力政企、创业者必读 22 DeepSeek出现之前的十大预判 之九 开源效果追赶上闭源 技术开放,吸引广大开发人员和用户使用 很多公司参与开源,帮助改进产品,众人拾柴火焰高, 反哺开源产品,形成正循环政企、创业者必读 DeepSeek出现之前的十大预判 之十 中美差距快速缩小 美国预训练堆算力的路线不可持续,有待发现新范式“换道超车” 软件和算法差距并不大,主要差距在工程、硬件等方面 用起来更像真人,写作能力更强,想象力更丰富 31政企、创业者必读 DeepSeek-R1用户体验改善的作用 R1在零广告投入下7天增长1亿用户,创最快应用破亿里程碑 把人工智能从不可用、凑合用,变成大家都能用、都爱用 推动市场加速发展,在中国用户、企业和政府彻底普及了一次AI 中国可能成为全球AI普及率、渗透率最高的国家, 加速了中国爆 发AI产业革命的步伐 DeepSeek颠覆式创新——用户体验 命运共同体 DeepSeek颠覆式创新——免费 36政企、创业者必读 DeepSeek引爆应用奇点 东西又好又免费,每个人都能拥有 DeepSeek颠覆式创新——结论 企业中各场景都可用DeepSeek改进,降本增效,企业应用爆发 所有产品都值得被DeepSeek重构,产品应用爆发 创业公司得到DeepSeek加持,创业者拥有便宜领先的大模型,迎来 机遇,带来“iPhone时刻”0 码力 | 76 页 | 5.02 MB | 5 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单DeepSeek+DeepResearch 让科研像聊天一样简单 北京航空航天大学 高研院 助理教 授 清华大学新闻学院与人工智能学 院双聘教授 沈阳团队博士后 何静 能做什么? 要怎么做? 效果如何? 一 能做什么? 数据挖掘 数据分析 数据采集 数据处理 数据可视化 AIGC 数据应用 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采 集社交媒体数据、数据库内容、文本数据、接口数据等。 性能之间取得平衡,适合 中等规模任务。 多模态支持:支持文本和 图像处理,扩展应用场景。 可解释性:注重模型输出 的可解释性和透明性。 DeepSeek R1 高效推理:专注于低延迟和 高吞吐量,适合实时应用。 轻量化设计:模型结构优化, 资源占用少,适合边缘设备 和移动端。 多任务支持:支持多种任务, 如文本生成、分类和问答。 Kimi k1.5 垂直领域优化:针对特定领域 验证的最终依据。 数据可视化 基于titanic遇难者数据分析结果绘制可 视化图表 任务 Open AI o3mini的数据可视化能力突出,能够直接高效地生成多种类型可视化图表,准确度高; DeepSeek R1、Kimi k1.5均能基于分析结果提供多种可视化图表绘制方案,但都需要依靠运行 Python代码才能完成绘图任务,部分代码会出现错误 Open AI o3mini0 码力 | 85 页 | 8.31 MB | 8 月前3
DeepSeek从入门到精通(20250204)优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Googl 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 问题的每个步骤来得到答案 决策能力 依赖预设算法和规则进行决策 能够自主分析情况,实时做出决策 自主优化步骤,兼顾效率 与正确性 严格按指令执行,无自主优化 提示语示例 决策需求 验证性需求 "为降低物流成本,现有两种方案: ①自建区域仓库(初期投入高,长期成本低) ②与第三方合作(按需付费,灵活性高) 请根据ROI计算模型,对比5年内的总成本并推荐最优 解。" �实战技巧: "以下是某论文结论:'神经网络模型A优于传统方法B'。 请验证: ①0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Googl 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 问题的每个步骤来得到答案 决策能力 依赖预设算法和规则进行决策 能够自主分析情况,实时做出决策 自主优化步骤,兼顾效率 与正确性 严格按指令执行,无自主优化 提示语示例 决策需求 验证性需求 "为降低物流成本,现有两种方案: ①自建区域仓库(初期投入高,长期成本低) ②与第三方合作(按需付费,灵活性高) 请根据ROI计算模型,对比5年内的总成本并推荐最优 解。" �实战技巧: "以下是某论文结论:'神经网络模型A优于传统方法B'。 请验证: ①0 码力 | 103 页 | 5.40 MB | 8 月前3
开源中国 2023 大模型(LLM)技术报告AI 编程 插件、IDE、终端 代码生成工具 编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心,随着大规模语言数据集的可用性和计算能 力的提升,研究者们开始设计更大规模的神经网络,以提高对语言复杂性的理解。 GPT (Generative Pre-trained Transformer) 的提出标志着 LLM 技术的飞速发展,其预训练和微调的 相结合, 使得 LLM 在广泛的应用场景中都能发挥出色的性能。 8 / 32 LLM 基础设施:大模型框架及微调 (Fine Tuning) 大模型框架有哪些特点: :大模型开发框架通过提供高 层次的 API 简化了复杂模型的构建过程。这 些 API 抽象掉了许多底层细节,使开发者能 够专注于模型的设计和训练策略。 :这些框架经过优化,以充分利用 GPU、TPU 等高性能计算硬件,以加速模型 -tuned-llm-67bf0b5df081) 10 / 32 LLM 基础设施:大模型训练平台与工具 大模型训练平台和工具提供了强大且灵活的基础设施,使得开发和训练复杂的语言模型变得可行且高 效。 这些工具提供了先进的算法、预训练模型和优化技术,极大地简化了模型开发过程,加速了实验周期, 并使得模型能够更好地适应各种不同的应用场景。此外,它们还促进了学术界和工业界之间的合作与 知识共享0 码力 | 32 页 | 13.09 MB | 1 年前3
清华大学第二弹:DeepSeek赋能职场(操作路径开放) Result (结果导向) 目标确定性高 (结果可预期) 目标开放性高 (结果多样性) Route (路径灵活性) 线性路径 (流程标准化) 网状路径 (多路径探索) Responsiveness (响应模式) 被动适配 (按规则执行) 主动创新 (自主决策) Risk (风险特征) 低风险 (稳定可控) 高风险 (不确定性高) (限定于文本生成任务) DeepSeek 两种模型对比0 码力 | 35 页 | 9.78 MB | 8 月前3
DeepSeek图解10页PDFDeepSeek-R1 完整训练过程 DeepSeek-R1 主要亮点在于出色的数学和逻辑推理能力,区别于一般的通 用 AI 模型。其训练方式结合了强化学习(RL)与监督微调(SFT),创造 了一种高效训练,高推理能力 AI 模型的方法。 整个训练过程分为核心两阶段,第一步训练基于 DeepSeek-V3 论文中的基 础模型(而非最终版本),并经历了 SFT 和基于纯强化学习调优 + 通用性 教程作者:郭震,工作 习优化:基于帮助性和安全性奖励模型,优化推理与非推理任务表现,构建 通用性强的模型。最终,DeepSeek-R1 将 R1-Zero 的推理能力与通用强化 学习的适应能力相结合,成为一个兼具强推理能力和任务广泛适应性的高 效 AI 模型。 核心创新总结 中间推理模型生成:通过推理导向的强化学习(Reasoning-Oriented RL),直接生成高质量的推理数据(CoT 示例),减少人工标注依赖。 通用强0 码力 | 11 页 | 2.64 MB | 8 月前3
国家人工智能产业综合标准化体系建设指南(2024版)为深入贯彻落实党中央、国务院关于加快发展人工智能 的部署要求,贯彻落实《国家标准化发展纲要》《全球人工 智能治理倡议》,进一步加强人工智能标准化工作系统谋划, 加快构建满足人工智能产业高质量发展和“人工智能+”高水 平赋能需求的标准体系,夯实标准对推动技术进步、促进企 业发展、引领产业升级、保障产业安全的支撑作用,更好推 进人工智能赋能新型工业化,特制定本指南。 一、产业发展现状 人工智能是引领新一轮科技革命和产业变革的基础性0 码力 | 13 页 | 701.84 KB | 1 年前3
普通人学AI指南2,时间线主要根据技术论文的发布日期(例如提交至 arXiv 的日期)来 确定大型语言模型(大小超过 10B)的发展历程。如果没有相应的论文,我们 将模型的日期设定为其公开发布或宣布的最早时间。我们用黄色标记那些公开 可用的模型检查点。由于空间限制,我们只包括那些公开报道评估结果的大型 语言模型。 Figure 2: 各个大型语言模型发布时间线 5 1.4 基础概念 1.4.1 上下文窗口 上下文窗口指的是0 码力 | 42 页 | 8.39 MB | 8 月前3
共 12 条
- 1
- 2













