清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单清华大学新闻学院与人工智能学 院双聘教授 沈阳团队博士后 何静 能做什么? 要怎么做? 效果如何? 一 能做什么? 数据挖掘 数据分析 数据采集 数据处理 数据可视化 AIGC 数据应用 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采 集社交媒体数据、数据库内容、文本数据、接口数据等。 通过数据清洗、数据集成、数据变换、特征工程等方式,实 现数据纠错、数据整合、格式转换、特征提取等。 通用性强:适用于多种自 然语言处理任务,如对话 生成和文本理解。 爬虫数据采集 1、阅读网页源代码,提取特定网页内容; 2、撰写python脚本; 3、提取并合并网址; 4、提取网址内容; 5、写入文件。 任务 你需要完成以下两个任务: 1.阅读网页【网址】源代码【对应网页源代码】。提取所 有包含“春运2025丨X月X日,全社会跨区域人员流动量完 成X万人次”的网址进行去重、筛选,合并成网址列表 响应速度快,能够高效提 取所有需求链接,输出完 整可运行python脚本,代 码运行后生成文件,但数 据采集结果为空。 DeepSeek R1 能够提取所有网址并进行 筛选、去重,所撰写代码 运行后完成数据爬虫任务, 所获取数据准确,少量数 据有所遗漏。 提示词 测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响,仅供参考,无法作为决策制定、质量评估或产品验证的最终依据。0 码力 | 85 页 | 8.31 MB | 8 月前3
JavaScript 正则表达式迷你书 老姚 - v1.1当然,也有相应的范围表示法。 1.2.3. 常见的简写形式 有了字符组的概念后,一些常见的符号我们也就理解了。因为它们都是系统自带的简写形式。 字符组 具体含义 \d 表示 [0-9]。表示是一位数字。 记忆方式:其英文是 digit(数字)。 \D 表示 [^0-9]。表示除数字外的任意字符。 \w 表示 [0-9a-zA-Z_]。表示数字、大小写字母和下划线。 记忆方式:w 是 word 的简写,也称单词字符。 [^\n\r\u2028\u2029]。通配符,表示几乎任意字符。换行符、回车符、行分隔符和段分隔符 除外。 记忆方式:想想省略号 … 中的每个点,都可以理解成占位符,表示任何类似的东西。 如果要匹配任意字符怎么办?可以使用 [\d\D]、[\w\W]、[\s\S] 和 [^] 中任何的一个。 以上各字符组对应的可视化形式是: JavaScript 正则表达式迷你书 1. 第一章 正则表达式字符匹配攻略 | 第 8 页 1 贪婪匹配与惰性匹配 看如下的例子: var regex = /\d{2,5}/g; var string = "123 1234 12345 123456"; console.log( string.match(regex) ); // => ["123", "1234", "12345", "12345"] 其中正则 /\d{2,5}/,表示数字连续出现 2 到 5 次。会匹配 2 位、3 位、40 码力 | 89 页 | 3.42 MB | 11 月前3
JavaScript 正则表达式迷你书 老姚 - v1.0当然,也有相应的范围表示法。 1.2.3. 常见的简写形式 有了字符组的概念后,一些常见的符号我们也就理解了。因为它们都是系统自带的简写形式。 字符组 具体含义 \d 表示 [0-9]。表示是一位数字。 记忆方式:其英文是 digit(数字)。 \D 表示 [^0-9]。表示除数字外的任意字符。 \w 表示 [0-9a-zA-Z_]。表示数字、大小写字母和下划线。 记忆方式:w 是 word 的简写,也称单词字符。 [^\n\r\u2028\u2029]。通配符,表示几乎任意字符。换行符、回车符、行分隔符和段分隔符 除外。 记忆方式:想想省略号 … 中的每个点,都可以理解成占位符,表示任何类似的东西。 如果要匹配任意字符怎么办?可以使用 [\d\D]、[\w\W]、[\s\S] 和 [^] 中任何的一个。 以上各字符组对应的可视化形式是: JavaScript 正则表达式迷你书 1. 第一章 正则表达式字符匹配攻略 | 第 8 页 1 贪婪匹配与惰性匹配 看如下的例子: var regex = /\d{2,5}/g; var string = "123 1234 12345 123456"; console.log( string.match(regex) ); // => ["123", "1234", "12345", "12345"] 其中正则 /\d{2,5}/,表示数字连续出现 2 到 5 次。会匹配 2 位、3 位、40 码力 | 89 页 | 3.42 MB | 11 月前3
强大的音视频处理工具: FFmpegVideoHandler Stream Stream #0:1(eng): Audio: aac (LC) (mp4a / 0x6134706D), #0:1(eng): Audio: aac (LC) (mp4a / 0x6134706D), Metadata: Metadata: creation_time creation_time 0x31637661 Stream Stream #0:1(eng): Audio: aac (LC) (mp4a / 0x6134706D), #0:1(eng): Audio: aac (LC) (mp4a / 0x6134706D), Metadata: Metadata: creation_time creation_time input/5d41d82f52247ce73d40475b.mp4 -vf ffmpeg -i input/5d41d82f52247ce73d40475b.mp4 -vf "pad=width "pad=width ffmpeg -i input/5d41d82f52247ce73d40475b.mp4 -vf ffmpeg -i input/5d41d82f52247ce73d40475b0 码力 | 73 页 | 11.57 MB | 1 年前3
Ubuntu 桌面培训 2010II.IV 自定义屏幕分辨率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270 VI.III 3D 特效 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 本课小结 上机练习 表 5 第 一 天 - 第 5 章 课程概况 31 Ubuntu 桌面培训 目录 章节 时长(分钟) 第二天 自定义桌面和应用程序 80 简介 自定义桌面 3D 特效 使用 Nautilus 管理文件 使用 Ubuntu 软件中心和新立得软件包管理器来添加或删 除应用程序 安装单个软件包文件 软件仓库 添加新语言设置 本课小结 复习题 上机练习 品设计和生产技术发展。它既是理论,也是具体的实践。开源的广泛实践使得软件用 户可以获得他们所使用软件的源代码,并且知识产权限制很少甚至没有,这允许用户 对软件进行修改,或者利用获得的代码编写并发布新的软件,使其满足自身需要,或 者进行互相协作以改进开源软件。开源和 Linux 都是在逐步变化的过程中,形成今天 的样子的。 自由分发的源代码的想法是为了鼓励人们自愿地、相互协同地开发软件。用户不断参 与增强软件、修复缺陷、开发新功能并且和其他人分享。0 码力 | 540 页 | 26.26 MB | 1 年前3
RocketMQ v3.2.4 开发指南will be the first discarded. c) LifoOrder - The last event received will be the first discarded. d) PriorityOrder - Events should be discarded in priority order, such that lower priority 项目开源主页:https://github com/alibaba/RocketMQ 28 */ consumer.subscribe("TopicTest1", "TagA || TagC || TagD"); 如以上代码所示,简单消息过滤通过挃定多个 Tag 来过滤消息,过滤劢作在服务器迕行。实现原理参照第 7.4 节 8.2 高级消息过滤 Broker Filter Server Filter Server 难以全面利用高配的物理机 Cpu 资源 4. 因为过滤代码使用 Java 诧言来编写,应用几乎可以做任意形式的服务器端消息过滤,例如通过 Message Header 迕行过滤,甚至可以挄照 Message Body 迕行过滤。 5. 使用 Java 诧言迕行作为过滤表达式是一个双刃剑,方便了应用的过滤操作,但是带来了服务器端的安全风险。 需要应用来保证过滤代码安全,例如在过滤程序里尽可能丌做申请大内存,创建线程等操作。避免0 码力 | 52 页 | 1.61 MB | 1 年前3
清华大学 DeepSeek 从入门到精通商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 剧本或对话设计 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据 需 求 生 成 代 码片段(Python、 JavaScript) • 自 动 补 全 调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像 推理模型那样复杂的推理和决策能力。 维度 推理模型 通用模型 优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断0 码力 | 103 页 | 5.40 MB | 8 月前3
基于go和flutter的实时通信/视频直播解决方案 段维伟发起的跨全平台高性能UI框架 • 基于 Skia 2D 渲染引擎 • 使用类似JS/TS的Dart 语言开发 • 支持代码编辑后热重载, Flutter 支持那些平台 iOS/Android/Web/Windows/Linux/macOS/Embedded 使用flutter 开发app意味着什么? • 无需为每个平台独立维护代码 • 一次编码,多平台运行,效率最大化 • 多平台一致性体验 Orlando Co https://github.com/OrlandoCo • CloudWebRTC https://github.com/cloudwebrtc pion 和 ion 社区的所有代码均为MIT授权, 相关github 地址如下: https://github.com/pion/ion https://github.com/flutter-webrtc https://github0 码力 | 38 页 | 2.22 MB | 1 年前3
消息中间件RocketMQ原理解析 - 斩秋rocketmq 源码过程中的笔记中整理出来的,由于时间及能力原因,理 解有误之处还请谅解,希望对大家学习使用 rocketmq 有所帮助。 Rocketmq 是阿里基于开源思想做的一款产品,代码托管于 github 上,要想学好用好 rocketmq 请从 https://github.com/alibaba/RocketMQ 获取最权威的文档、问题解答、原理介 绍等。 Balance(topic) 获取消费的队 列 业务自己获取消费队列,自己到 broker 拉取消息,以及自己更新消费进度 因为内部实现跟 push 方式类似就不在啰嗦,用法也请求看示例代码去 七:shutdown DefaultMQPushConsumerImpl 关闭消费端 关闭消费线程 将分配到的 Set的消费进度保存到 后 存 放 propertiesLength 大小的属性数据 3) MapedFile 是 PageCache 文件封装,操作物理文件在内存中的映射以及将内存数据持久 化到物理文件中, 代码中写死了要求 os 系统的页大小为 4k, 消息刷盘根据参数 (commitLog 默认至少刷 4 页, consumeQueue 默认至少刷 2 页)才刷 以下 io 对象构建了物理文件映射内存的对象 0 码力 | 57 页 | 2.39 MB | 1 年前3
MySQL高可用 - 多种方案/usr/local/keepalived/etc/sysconfig/keepalived /etc/sysconfig/ cp /usr/local/keepalived/etc/rc.d/init.d/keepalived /etc/init.d/ mkdir /etc/keepalived 2.4.7 Keepalived 的配置 2.4.7.1 Master 的 keepalived 的配置 Master 和 backup 是一致的,脚本内容如下: vim /etc/rc.d/init.d/realserver.sh #!/bin/bash # description: Config realserver lo and apply noarp SNS_VIP=10.1.1.176 /etc/rc.d/init.d/functions case "$1" in start) keepalived 和 realserver 脚本: /etc/rc.d/init.d/realserver.sh start /etc/rc.d/init.d/keepalived start 并将 keepalived 和 realserver 的启动脚本加入到 rc.local 自启动中: echo “/etc/rc.d/init.d/realserver.sh start” >> /etc/rc0 码力 | 31 页 | 874.28 KB | 1 年前3
共 19 条
- 1
- 2













