清华大学 DeepSeek 从入门到精通
CoT链式思维的出现将大模型分为了两类:“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 适的模型,实现最佳效果。 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 避免误区 • 不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。 • 不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。 从“下达指令”到“表达需求” 策略类型 定义与目标 适用场景 示例(推理模型适用) 优势与风险 指令驱动 直接给出明确步骤或 格式要求 简单任务、需快速执行 “用Python编写快速排序函 数,输出需包含注释。” ✅ 结果精准高效 探索性问题、需模型解 释逻辑 “为什么选择梯度下降法解 决此优化问题?请对比其他 算法。” ✅ 触发模型自解释能力 ❌ 可能偏离核心目标 任务需求与提示语策略 任务类型 适用模型 提示语侧重点 示例(有效提示) 需避免的提示策略 数学证明 推理模型 直接提问,无需分步引导 “证明勾股定理” 冗余拆解(如“先画图,再列公式”) 通用模型 显式要求分步思考,提供示例 “请分三步推导勾股定理,参考:0 码力 | 103 页 | 5.40 MB | 8 月前3清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单
现数据纠错、数据整合、格式转换、特征提取等。 对数据进行诊断、预测、关联、聚类分析,常用于问题 定位、需求预测、推荐系统、异常检测等。 对数据进行分类、社交网络分析或时序模式挖掘,常用 于客户细分、信用评分、社交媒体营销、股价预测等。 将数据转化为统计图、热力图、网络关系图、词云、树形 图等,用于揭示数据中蕴含的模式、趋势、异常和洞见。 本质:以多agent实现从数据采集到可视全流程 模型特点 Claude 测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响,仅供参考,无法作为决策制定、质量评估或产品验证的最终依据。 DeepSeek R1 文件数据读取完整无缺失 数据分析全面、逻辑清晰严谨 网络爬虫任务数据爬取完整、准确 数据挖掘能够准确分类并提供建议 数据可视化任务能力有待完善 Claude 3.5 sonnet 数据读取输出逻辑性强、指标清晰 数据分析任务完成得较为简单 数据分析任务完成得较为简单 爬虫数据采集未形成明确结论 数据挖掘深度较浅 绘制出可视图表不稳定 Open AI o3 mini 数据分析高效、全面、准确 数据可视化能力突出、直接生成 网络爬虫任务爬取数据结果为空 暂不支持上传数据附件 数据挖掘深度较浅 Kimi k1.5 数据挖掘能力出色 快速读取文件数据,提取网址链接 长文本数据处理能力突出 爬虫数据采集存在代码错误问题0 码力 | 85 页 | 8.31 MB | 7 月前3RocketMQ v3.2.4 开发指南
...................................................................................... 16 7.2 刷盘策略 .................................................................................................. ........................................................................................ 29 9.1 网络协议 ................................................................................................ 可以严格的保证消息有序。 4.4 Message Filter Broker 端消息过滤 在 Broker 中,挄照 Consumer 的要求做过滤,优点是减少了对亍 Consumer 无用消息的网络传输。 缺点是增加了 Broker 的负担,实现相对复杂。 (1). 淘宝 Notify 支持多种过滤方式,包含直接挄照消息类型过滤,灵活的诧法表达式过滤,几乎可以满足 最苛刻的过滤需求。0 码力 | 52 页 | 1.61 MB | 1 年前3谈谈MYSQL那点事
上面。比如月统计报表,比如首页推荐商品 业务实时性要求不是很高,完全可以采用这种弱一致性的设 计架构模式。 中间一致性 如果既不是很强的一致性又不是很弱的一致性,那 么我们就采取中间的策略,就是在同机房再部署一个 S1(R) ,作为备库,提供读取服务,减少 M1(WR) 的 压力,而另外一个 idc 机房的 M2 只做 standby 容灾方 式的用途。 当然这里会用到 MySQL MySQL 优化方式 优化方式 影响性能的因素 影响性能的因素 应用程序 应用程序 查询 查询 事务管理 事务管理 数据库设计 数据库设计 数据分布 数据分布 网络 网络 操作系统 操作系统 硬件 硬件 使用好的硬件,更快的硬盘、大内存、多核 使用好的硬件,更快的硬盘、大内存、多核 CPU CPU ,专业的 ,专业的 存储服务器( 存储服务器( NAS0 码力 | 38 页 | 2.04 MB | 1 年前3Ubuntu 桌面培训 2010
有限公司和 Ubuntu 培训社区创作 2008-2010。 这个协议受到知识共享署名-非商业性使用-相同方式共享的约束 基于这个协议,您可以自由: • 复制、发行、展览、表演、放映、广播或通过信息网络传播本作品 • 创作演绎作品 惟须遵守下列条件: • 署名。您必须按照作者或者许可人指定的方式对作品进行署名(但是不得以任何方式暗示它们支持您 或者您作品的使用)。 • 非商业性使用。您不得将本作品用于商业目的。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 III.I.I 网络管理器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 III.I 使用无线网卡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 III.II 浏览网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .0 码力 | 540 页 | 26.26 MB | 1 年前32022 Apache Ozone 的最近进展和实践分享
以计算为代价,在不降低数据可靠性的同 时,降低数据存储成本 数据可靠性 vs. 存储效率 纠删码策略 • 内建⽀持的策略 • RS-3-2-1024K • RS-6-3-1024K • XOR-2-1-1024K • 可定制新的策略 • 策略设置⽀持 • 全局策略设置 • 桶级别策略设置 • 对象/⽂件级别策略设置 数据写⼊ DN5 C-1 C-2 B-1-p B-2-p DN1 C-1 data2 data3 parity1 parity2 数据写⼊ • EC Container Group:给定Container的⼀组满⾜EC策略的副本实例 • 物理块:每个DN磁盘上的数据块,默认是256MB • 逻辑EC块:属于单个条带,满⾜EC策略的⼀组数据块。例如EC-3-2,⼀个逻辑块 3*256MB⼤⼩ • 条带粒度:条带的粒度默认1MB,可配置 数据读取 DN5 C-20 码力 | 35 页 | 2.57 MB | 1 年前3消息中间件RocketMQ原理解析 - 斩秋
......................................................................................... 40 五:刷盘策略 .................................................................................................. rebalanceByTopic 根据 topic 获取此 topic 下的所有 queue 选择一台 broker 获取基于 group 的所有消费端(有心跳向所有 broker 注册客户端信息) 选择队列分配策略实例 AllocateMessageQueueStrategy 执行分配算法,获取队列集合 SetmqSet 1) 平均分配算法,其实是类似于分页的算法 将所有 Master bodysize bodyData 4.3 HA 异步复制 五:刷盘策略 刷盘, 可以通过 setFlushDiskType 来指定刷盘策略, 同步,producer 发送消息到 broker 保证消息持久化到磁盘在返回 异步, 通过 FlushRealTimeService 服务异步实时刷盘 0 码力 | 57 页 | 2.39 MB | 1 年前3MySQL 8.0.17 调优指南(openEuler 20.09)
........................................................................................... 6 3.6 网络参数调优............................................................................................... 颈,然后根据其性能指标以及 所处层级选择优化的方式方法。 下面介绍MySQL数据库具体的调优思路和分析过程,如图1所示。 调优分析思路如下: 1. 很多情况下压测流量并没有完全进入到服务端,在网络上可能就会出现由于各种 规格(带宽、最大连接数、新建连接数等)限制,导致压测结果达不到预期。 2. 接着看关键指标是否满足要求,如果不满足,需要确定是哪个地方有问题,一般 情况下,服务器端问题可能 5. 如果以上指标都正常,应用程序的算法、缓冲、缓存、同步或异步可能有问题, 需要具体深入的分析。 瓶颈点 说明 硬件/规格 一般指的是CPU、内存、磁盘I/O方面的问题,分为服务器硬件瓶 颈、网络瓶颈(对局域网可以不考虑)。 操作系统 一般指的是Windows、UNIX、Linux等操作系统。例如,在进行性 能测试,出现物理内存不足时,虚拟内存设置也不合理,虚拟内 存的交换效率就会大大降低,从而导致行为的响应时间大大增0 码力 | 11 页 | 223.31 KB | 1 年前3JavaScript 正则表达式迷你书 老姚 - v1.1
JavaScript 正则表达式迷你书 4. 第四章 正则表达式回溯法原理 | 第 44 页 • 贪婪量词“试”的策略是:买衣服砍价。价钱太高了,便宜点,不行,再便宜点。 • 惰性量词“试”的策略是:卖东西加价。给少了,再多给点行不,还有点少啊,再给点。 • 分支结构“试”的策略是:货比三家。这家不行,换一家吧,还不行,再换。 既然有回溯的过程,那么匹配效率肯定低一些。相对谁呢?相对那些 DFA0 码力 | 89 页 | 3.42 MB | 10 月前3JavaScript 正则表达式迷你书 老姚 - v1.0
JavaScript 正则表达式迷你书 4. 第四章 正则表达式回溯法原理 | 第 44 页 • 贪婪量词“试”的策略是:买衣服砍价。价钱太高了,便宜点,不行,再便宜点。 • 惰性量词“试”的策略是:卖东西加价。给少了,再多给点行不,还有点少啊,再给点。 • 分支结构“试”的策略是:货比三家。这家不行,换一家吧,还不行,再换。 既然有回溯的过程,那么匹配效率肯定低一些。相对谁呢?相对那些 DFA0 码力 | 89 页 | 3.42 MB | 10 月前3
共 11 条
- 1
- 2