清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单成数据提取并写入文件“2025春运数据.txt” Open AI o3mini 响应速度快,能够高效提 取所有需求链接,输出完 整可运行python脚本,代 码运行后生成文件,但数 据采集结果为空。 DeepSeek R1 能够提取所有网址并进行 筛选、去重,所撰写代码 运行后完成数据爬虫任务, 所获取数据准确,少量数 据有所遗漏。 提示词 测试结果受到数据样本、测试环境、AI 不全、输出文本中提取数据为空等。 Kimi k1.5 能够提取所有网址,代码运 行后生成本地文件,但提取 数据结果为空。 结论 Claude 3.5 sonnet 可以提取所有网址,调整后可输出正 确代码,运行代码能生成本地文件, 但提取数据结果为空。 测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响,仅供参考,无法作为决策制定、质量评估或产品验证的最终依据。 2、对数据集进行深入分析和数据挖掘 任务 DeepSeek R1 能够准确对数据进行分类,从多个维度进行梳理和分析,借助可视化图表进行数据挖掘,基于分析结 果提供可行建议,但整体数据挖掘深度较浅,缺少对不同类型数据直接关联性的探究。 第一轮对话: 第二轮对话: (基于初步分析结果,选择其中一部分或某个方 向进行深入的数据挖掘) 提示词 测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因0 码力 | 85 页 | 8.31 MB | 8 月前3
消息中间件RocketMQ原理解析 - 斩秋messageQueueList.size 为队列集合的下标 每次获取 queue 都会通过 sendWhichQueue 加一来实现对所有 queue 的轮询 如果入参 lastBrokerName 不为空,代表上次选择的 queue 发送失败,这次选 择应该避开同一个 queue 3) Producer 发消息系统重试: 发送失败后,重试几次 retryTimesWhenSendFailed = 随机选择一台 producer 查询消息,根据 commitLogOffset 和 msgSize 到 commitlog 查找消息 向 Producder 发起请求,请求 code 类型为 CHECK_TRANSACTION_STATE,producer 的 DefaultMQProducerImpl. checkTransactionState()方法来处理 broker 定时回调的请求, 30W 条 = 300000 * CQStoreUnitSize(每条大小) filename: filename 文件名称但不仅仅是名称还表示文件记录的初始偏移量, 文件名其 实是个 long 类型的值 4) MapedFileQueue 存储队列,数据定时删除,无限增长。 队列有多个文件(MapedFile)组成,由集合对象 List 表示升序排列,前面讲到文件名即 是消息在此文0 码力 | 57 页 | 2.39 MB | 1 年前3
清华大学 DeepSeek 从入门到精通需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板(如要求分 步思考、提供示例)。 关键原则 3 2 1 模型选择 • 优先根据任务类型而非模型热度选择(如数学任务选推理模型,创意任务选通用 模型)。 提示语设计 • 不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。 从“下达指令”到“表达需求” 策略类型 定义与目标 适用场景 示例(推理模型适用) 优势与风险 指令驱动 直接给出明确步骤或 格式要求 简单任务、需快速执行 “用Python编写快速排序函 数,输出需包含注释。” ✅ 结果精准高效 ❌ 限制模型自主优化空 间 需求导向 描述问题背景与目标, 由模型规划解决路径 复杂问题、需模型自主 么”“如何”) 探索性问题、需模型解 释逻辑 “为什么选择梯度下降法解 决此优化问题?请对比其他 算法。” ✅ 触发模型自解释能力 ❌ 可能偏离核心目标 任务需求与提示语策略 任务类型 适用模型 提示语侧重点 示例(有效提示) 需避免的提示策略 数学证明 推理模型 直接提问,无需分步引导 “证明勾股定理” 冗余拆解(如“先画图,再列公式”) 通用模型 显式要求分步思考,提供示例0 码力 | 103 页 | 5.40 MB | 8 月前3
Ubuntu 桌面培训 2010. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 III.27 为接收邮件选择服务器类型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 III.28 提供 POP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 IV.39 选择图表类型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 458 IX.22 多种支持类型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .0 码力 | 540 页 | 26.26 MB | 1 年前3
JavaScript 正则表达式迷你书 老姚 - v1.1假设,要匹配这样的字符串: 1. 每个字符为 "a、"b"、"c" 任选其一, 2. 字符串的长度是 3 的倍数。 此时正则不能想当然地写成 /^[abc]{3}+$/,这样会报错,说 + 前面没什么可重复的: 此时要修改成: JavaScript 正则表达式迷你书 5. 第五章 正则表达式的拆分 | 第 48 页 5.2.3 元字符转义问题 所谓元字符,就是正则中有特殊含义的字符。 所有结构里,用到的元字符总结如下: \d+)$/ 也不是完美的,我们也是做了些取舍,比如: 它也会匹配 "012" 这样以 "0" 开头的整数。如果要求不匹配的话,需要修改整数部分的正则。一般进行验 证操作之前,都要经过 trim 和判空。那样的话,也许那个错误正则也就够用了。也可以进一步改写成: /^[+-]?(\d+)?(\.)?\d+$/,这样我们就需要考虑可读性和可维护性了。 6.4. 效率 保证了准确性后,才需要是否要 4.4. 提取分支公共部分 比如,/^abc|^def/ 修改成 /^(?:abc|def)/。 又比如, /this|that/修改成 /th(?:is|at)/。 这样做,可以减少匹配过程中可消除的重复。 6.4.5. 减少分支的数量,缩小它们的范围 /red|read/ 可以修改成 /rea?d/。 此时分支和量词产生的回溯的成本是不一样的。但这样优化后,可读性会降低的。 6.50 码力 | 89 页 | 3.42 MB | 11 月前3
JavaScript 正则表达式迷你书 老姚 - v1.0假设,要匹配这样的字符串: 1. 每个字符为 "a、"b"、"c"任选其一, 2. 字符串的长度是 3 的倍数。 此时正则不能想当然地写成 /^[abc]{3}+$/,这样会报错,说 + 前面没什么可重复的: 此时要修改成: JavaScript 正则表达式迷你书 5. 第五章 正则表达式的拆分 | 第 48 页 5.2.3 元字符转义问题 所谓元字符,就是正则中有特殊含义的字符。 所有结构里,用到的元字符总结如下: \d+)$/ 也不是完美的,我们也是做了些取舍,比如: 它也会匹配 "012" 这样以 "0" 开头的整数。如果要求不匹配的话,需要修改整数部分的正则。一般进行验 证操作之前,都要经过 trim 和判空。那样的话,也许那个错误正则也就够用了。也可以进一步改写成: /^[-]?(\d)?(\.)?\d+$/,这样我们就需要考虑可读性和可维护性了。 6.4. 效率 保证了准确性后,才需要是否要考虑 4.4. 提取分支公共部分 比如,/^abc|^def/ 修改成 /^(?:abc|def)/。 又比如, /this|that/修改成 /th(?:is|at)/。 这样做,可以减少匹配过程中可消除的重复。 6.4.5. 减少分支的数量,缩小它们的范围 /red|read/ 可以修改成 /rea?d/。 此时分支和量词产生的回溯的成本是不一样的。但这样优化后,可读性会降低的。 6.50 码力 | 89 页 | 3.42 MB | 11 月前3
RocketMQ v3.2.4 开发指南RocketMQ 中,所有消息队列都是持丽化,长度无限的数据结构,所谓长度无限是挃队列中的每个存储 单元都是定长,访问其中的存储单元使用 Offset 来访问,offset 为 java long 类型,64 位,理论上在 100 年内丌会溢出,所以讣为是长度无限,另外队列中只保存最近几天的数据,乀前的数据会挄照过期时间来 删除。 也可以讣为 Message Queue 是一个长度无限的数组,offset Consumer 的要求做过滤,优点是减少了对亍 Consumer 无用消息的网络传输。 缺点是增加了 Broker 的负担,实现相对复杂。 (1). 淘宝 Notify 支持多种过滤方式,包含直接挄照消息类型过滤,灵活的诧法表达式过滤,几乎可以满足 最苛刻的过滤需求。 (2). 淘宝 RocketMQ 支持挄照简单的 Message Tag 过滤,也支持挄照 Message Header、body 磁盘设备损坏。 (1)、(2)、(3)、(4)四种情冴都属亍硬件资源可立即恢复情冴,RocketMQ 在返四种情冴下能保证消息丌丢,戒 者丢失少量数据(依赖刷盘方式是同步迓是异步)。 (5)、(6)属亍单点故障,丏无法恢复,一旦収生,在此单点上的消息全部丢失。RocketMQ 在返两种情冴下,通 过异步复制,可保证 99%的消息丌丢,但是仍然会有极少量的消息可能丢失。通过同步双写技术可以完全避免单点,0 码力 | 52 页 | 1.61 MB | 1 年前3
强大的音视频处理工具: FFmpeg感谢我的⽼婆陈雪的包容理解和悉⼼照料,才使得我 crifan 有更多精 ⼒去专注技术专研和整理归纳出这些电⼦书和技术教程,特此鸣谢。 更多其他电⼦书 本⼈ crifan 还写了其他 100+ 本电⼦书教程,感兴趣可移步⾄: crifan/crifan_ebook_readme: Crifan的电⼦书的使⽤说明 crifan.com,使⽤署名4.0国际(CC BY 4.0)协议发布 all right reserved, le.mp4 从视频中提取出字幕 ffmpeg -i video_with_soft_subtitle.mp4 -map 0:s:0 extracted_subtitle.srt 字幕类型转换 srt转换为ass ffmpeg -i subtitle.srt subtitle.ass 另外还有: ffmpeg 被其他⼯具调⽤:⽤于解析和操作⾳视频 Python的⾳频处理库: 脚本说明 Script Info: 脚本的⼀般全局信息: Title:标题 Original Script:脚本原作 Script Updated By:脚本优化 Script Type:类型 ⽤于兼容性设置 SSA=4.00 ASS=4.00+ PlayResX & PlayResY:屏幕宽⾼ PlayDepth:决定颜⾊数量 Timer:定时器 V4 Styles: 定0 码力 | 73 页 | 11.57 MB | 1 年前3
谈谈MYSQL那点事query_cache_size 0 ( 不打开 ) 128M 查询缓存区的最大长度,按照当前需求,一 倍一倍增加,本选项比较重要 sort_buffer_size 512K 128M 每个线程的排序缓存大小,一般按照内存可 以设置为 2M 以上,推荐是 16M ,该选项对 排序 order by , group by 起作用 record_buffer 128K 64M 每个进行一个顺序扫描的线程为其扫描的每 张表分配这个大小的一个缓冲区,可以设置 不用 bigint ,为什么 ? 省空间啊。空间是什么 ? 空间就是效率!按 4 个字节和按 32 个字节定位一条记 录,谁快谁慢太明显了。涉及几个表做 join 时, 效果 就更明显了。更小的字段类型占用的内存就更少,占用 的磁盘空间和磁盘 I/O 也会更少,而且还会占用更少的 带宽。因此 . 在日常选择字段时必须要遵守这一规则。 应用优化 应用优化 索引建立原则(一) 索引建立原则(一) 、 、 date/tim date/tim e e 等 等 类型的字段建立索引 类型的字段建立索引 需要的时候建立联合索引,但是要注意查询 需要的时候建立联合索引,但是要注意查询 SQL SQL 语句的编写 语句的编写 谨慎建立 谨慎建立 unique unique 类型的索引(唯一索引) 类型的索引(唯一索引) 大文本字段不建立为索引,如果要对大文本字段进行检索,0 码力 | 38 页 | 2.04 MB | 1 年前3
MySQL高可用 - 多种方案http://blog.chinaunix.net/uid/20639775.html 1 前言 Mysql 高可用一直是 mysql 业界不断讨论的热点问题,其中涉及的东西比较多,可 供选择的方案也相当多,面对这么多的方案,我们应该如何选择适合自己公司的 mysql 高可用方案呢,我觉得首先我们需要了解的自己公司的业务,了解在线系统中那些东西 会影响高可用,以及了解各个高可用方 Lvs+Keepalived、Heartbeat、MMM、mysql cluster 三种方式, 由 于 时 间 关 系 这 里 不 对 mysql cluster 做 介 绍 , 有 兴 趣 的 可 以 访 问 http://blog.chinaunix.net/uid-20639775-id-201960.html,下面就逐一地来详细介绍其他几种高 可用方案。 2 Lvs+Keepalived+Mysql 10.1.1.176 Centos 5.5 64bit 5.1.63 2.4.3 Mysql 的安装和配置 Mysql 的安装和配置相对来讲非常简单,这里就不做介绍,有兴趣的朋友 可 以 查 看 我 博 客 中 关 于 mysql 5.1.63 版 本 自 动 安 装 的 文 章 http://blog.chinaunix.net/uid-20639775-id-31687370 码力 | 31 页 | 874.28 KB | 1 年前3
共 17 条
- 1
- 2













