清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单DeepSeek+DeepResearch 让科研像聊天一样简单 北京航空航天大学 高研院 助理教 授 清华大学新闻学院与人工智能学 院双聘教授 沈阳团队博士后 何静 能做什么? 要怎么做? 效果如何? 一 能做什么? 数据挖掘 数据分析 数据采集 数据处理 数据可视化 AIGC 数据应用 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采 集社交媒体数据、数据库内容、文本数据、接口数据等。 网络爬虫任务数据爬取完整、准确 数据挖掘能够准确分类并提供建议 数据可视化任务能力有待完善 Claude 3.5 sonnet 数据读取输出逻辑性强、指标清晰 数据分析任务完成得较为简单 爬虫数据采集未形成明确结论 数据挖掘深度较浅 绘制出可视图表不稳定 Open AI o3 mini 数据分析高效、全面、准确 数据可视化能力突出、直接生成 网络爬虫任务爬取数据结果为空 do you see here? Give me a numbered list. 提供一些见解 Can you explain this dataset in simple terms? 用简单的话来解释一下这个数据集 其他常用中文指令 Prompts(指令) 跨学科融合:将“舆论分析”概念与其他领域的最新具有突破性的理论深度结合,提出极其具有创新的交叉领域的十个问题。 探索“舆论0 码力 | 85 页 | 8.31 MB | 8 月前3
Ubuntu 桌面培训 2010• 使用 Ubuntu 的好处 • 如何自定义 Ubuntu 桌面的外观 • 如何在文件系统中进行浏览和查找文件 • 如何连接并使用互联网 • 如何使用 OpenOffice.org 进行简单的文本处理和使用电子表格 • 如何安装和运行游戏 • 如何添加、删除和更新应用程序 • 如何查看、绘制、处理和扫描图像 • 如何播放、编辑和管理您的音乐和视频文件 • 如何从免费的或商业的资源中获取关于 7.10 (Gutsy Gibbon, 胆 大 的 长 臂 猿 ) 2007年10月 发 布 , 支 持 到 2009年04月。主要特性包括:默认支持绚丽的视觉效果,快速用户切换,打印机 自动检测和更简单的桌面文件搜索和追踪。 • Ubuntu 8.04 LTS (Hardy Heron,坚强的苍鹭) 2008年04月发布,是 Ubuntu 的第二个长期支持版本。桌面支持到 2011年04月,服务器支持到 以 Live CD 的形式发布,这意味着您可以不安装它而直接从光盘启动并 运行系统。如果您喜欢它,再安装;如果不,您还可以把它送给需要的朋友。Live CD 在恢复系统时也很有用。 二者的安装都比较简单,运行安装光盘然后启动电脑,安装所花费时间取决于计算 机的性能,平均需要 10 到 20 分钟。 • 软件安装在 Ubuntu 中,您可以使用 Ubuntu 软件中心和新立得软件包管理器来 添加软件。在0 码力 | 540 页 | 26.26 MB | 1 年前3
JavaScript 正则表达式迷你书 老姚 - v1.1第二章 正则表达式位置匹配攻略 • 第三章 正则表达式括号的作用 • 第四章 正则表达式回溯法原理 • 第五章 正则表达式的拆分 • 第六章 正则表达式的构建 • 第七章 正则表达式编程 下面简单地说说每一章都讨论了什么? 正则是匹配模式,要么匹配字符,要么匹配位置。 第一章和第二章以这个角度去讲解了正则表达式的基础。 在正则可以使用括号捕获数据,要么在 API 中进行分组引用,要么在正则里进行反向引用。 平的一个侧面标准。 括号的作用,其实三言两语就能说明白,括号提供了分组,便于我们引用它。 引用某个分组,会有两种情形:在 JavaScript 里引用它,在正则表达式里引用它。 本章内容虽相对简单,但我也要写长点。 内容包括: • 分组和分支结构 • 分组引用 • 反向引用 • 非捕获括号 • 相关案例 3.1. 分组和分支结构 这二者是括号最直觉的作用,也是最原始的功能,强 这是括号一个重要的作用,有了它,我们就可以进行数据提取,以及更强大的替换操作。 而要使用它带来的好处,必须配合使用实现环境的 API。 以日期为例。假设格式是 yyyy-mm-dd 的,我们可以先写一个简单的正则: var regex = /\d{4}-\d{2}-\d{2}/; 其可视化形式是: 然后再修改成括号版的: var regex = /(\d{4})-(\d{2})-(\d{2})/;0 码力 | 89 页 | 3.42 MB | 11 月前3
JavaScript 正则表达式迷你书 老姚 - v1.0第二章 正则表达式位置匹配攻略 • 第三章 正则表达式括号的作用 • 第四章 正则表达式回溯法原理 • 第五章 正则表达式的拆分 • 第六章 正则表达式的构建 • 第七章 正则表达式编程 下面简单地说说每一章都讨论了什么? 正则是匹配模式,要么匹配字符,要么匹配位置。 第一章和第二章以这个角度去讲解了正则表达式的基础。 在正则可以使用括号捕获数据,要么在 API 中进行分组引用,要么在正则里进行反向引用。 平的一个侧面标准。 括号的作用,其实三言两语就能说明白,括号提供了分组,便于我们引用它。 引用某个分组,会有两种情形:在 JavaScript 里引用它,在正则表达式里引用它。 本章内容虽相对简单,但我也要写长点。 内容包括: • 分组和分支结构 • 分组引用 • 反向引用 • 非捕获括号 • 相关案例 3.1. 分组和分支结构 这二者是括号最直觉的作用,也是最原始的功能,强 这是括号一个重要的作用,有了它,我们就可以进行数据提取,以及更强大的替换操作。 而要使用它带来的好处,必须配合使用实现环境的 API。 以日期为例。假设格式是 yyyy-mm-dd 的,我们可以先写一个简单的正则: var regex = /\d{4}-\d{2}-\d{2}/; 其可视化形式是: 然后再修改成括号版的: var regex = /(\d{4})-(\d{2})-(\d{2})/;0 码力 | 89 页 | 3.42 MB | 11 月前3
RocketMQ v3.2.4 开发指南........................................................................................ 27 8.1 简单消息过滤 .............................................................................................. 的负担,实现相对复杂。 (1). 淘宝 Notify 支持多种过滤方式,包含直接挄照消息类型过滤,灵活的诧法表达式过滤,几乎可以满足 最苛刻的过滤需求。 (2). 淘宝 RocketMQ 支持挄照简单的 Message Tag 过滤,也支持挄照 Message Header、body 迕行过滤。 (3). CORBA Notification 规范中也支持灵活的诧法表达式过滤。 Consumer 费,但是每次提交的 Offset 都是最小 Offset,例如 3 7.11 发送定时消息 7.12 消息消费失败,定时重试 7.13 HA,同步双写/异步复制 异步复制的实现思路非常简单,Slave 启劢一个线程,丌断从 Master 拉叏 Commit Log 中的数据,然后在异步 build 出 Consume Queue 数据结构。整个实现过程基本同 Mysql 主从同步类似。0 码力 | 52 页 | 1.61 MB | 1 年前3
清华大学 DeepSeek 从入门到精通不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。 从“下达指令”到“表达需求” 策略类型 定义与目标 适用场景 示例(推理模型适用) 优势与风险 指令驱动 直接给出明确步骤或 格式要求 简单任务、需快速执行 “用Python编写快速排序函 数,输出需包含注释。” ✅ 结果精准高效 ❌ 限制模型自主优化空 间 需求导向 描述问题背景与目标, 由模型规划解决路径 复杂问题、需模型自主 结合逻辑框架生成结构化 创意 自由发散,依赖示例引导 4. 验证需求 需检查逻辑自洽性、数 据可靠性或方案可行性 结论/方案 + 验证方法 + 风险点 自主设计验证路径并排查 矛盾 简单确认,缺乏深度推演 5. 执行需求 需完成具体操作(代码/ 计算/流程) 任务 + 步骤约束 + 输出格 式 自主优化步骤,兼顾效率 与正确性 严格按指令执行,无自主优化 提示语示例 提供三种不同技术路线的原型草图说明。" �实战技巧: 还要不要学提示语? 提示语(Prompt)是用户输入给AI系统的指令或信息,用于 引导AI生成特定的输出或执行特定的任务。简单来说,提示语 就是我们与AI“对话”时所使用的语言,它可以是一个简单的问 题,一段详细的指令,也可以是一个复杂的任务描述。 提示语的基本结构包括指令、上下文和期望 ▪ 指令(Instruction):这是提示语的核心,明确告诉AI你希望0 码力 | 103 页 | 5.40 MB | 9 月前3
MySQL高可用 - 多种方案有问题、服务器宕机、keepalived 服务停止后,服务器能自动跳转到备用机, 当主服务器服务启动起来后会自动切换回来。 2.2 方案架构图 2.3 方案优缺点 优点: 安装配置简单,实现方便,高可用效率好,可以根据服务与系统的可用性 多方面进行切换。 可以将写 VIP 和读 VIP 分别进行设置,为读写分离做准备。 扩展不是很方便。 可以在后面添加多个从服务器,并做到负载均衡。 Backup 10.1.1.75 10.1.1.176 Centos 5.5 64bit 5.1.63 2.4.3 Mysql 的安装和配置 Mysql 的安装和配置相对来讲非常简单,这里就不做介绍,有兴趣的朋友 可 以 查 看 我 博 客 中 关 于 mysql 5.1.63 版 本 自 动 安 装 的 文 章 http://blog.chinaunix.net/uid-20639775-id-3168737 1.75 10.1.1.176 10.1.1.177 Centos 5.5 64bit 5.1.63 3.5.2 Mysql 的安装和配置 Mysql 的安装和配置相对来讲非常简单,这里就不做介绍,有兴趣的朋友可 以 查 看 我 博 客 中 关 于 mysql 5.1.63 版 本 自 动 安 装 的 文 章 http://blog.chinaunix.net/uid-20639775-id-31687370 码力 | 31 页 | 874.28 KB | 1 年前3
谈谈MYSQL那点事技巧分享 Q Q & & AA MyISAM MyISAM 特点 特点 MyISAM vs MyISAM vs InnoDB InnoDB • 数据存储方式简单,使用 数据存储方式简单,使用 B+ Tree B+ Tree 进行索引 进行索引 • 使用三个文件定义一个表: 使用三个文件定义一个表: .MYI .MYD .frm .MYI .MYD plain-slow -log – – 德国工程师使用 德国工程师使用 Perl Perl 开发的把 开发的把 Slow Log Slow Log 输出到屏幕,功能简单 输出到屏幕,功能简单 mysql-log-filter - Google code - Google code 上一个开源产品,报表 上一个开源产品,报表 简洁 简洁0 码力 | 38 页 | 2.04 MB | 1 年前3
强大的音视频处理工具: FFmpeginput.ts -filter_complex ffmpeg -i input.ts -filter_complex "[0:v][0: "[0:v][0: 获取 53 指定字幕位置 最简单但常⻅的需求:⽆需操⼼字幕的具体位置,只需要保证字幕在 视频底部 则可以直接嵌⼊字幕,其中字幕⽂件是srt或ass均可 ⾼级需求:指定字幕的具体的位置(不同区域,具体边距等) 前提:必须是a enable libass - Page 3 - FFmpeg SubStation Alpha - 维基百科,⾃由的百科全书 ffserver – FFmpeg ffmpeg——ffserver的⼀个简单demo - Eyrane的博客 - CSDN博客 ffmpeg+ffserver搭建流媒体服务器 - 静之深 - 博客园 ffmpeg Documentation Documentation0 码力 | 73 页 | 11.57 MB | 1 年前3
GPU Resource Management On JDOS提供统一便捷的 Serving 服务,只需用户指定模型,即可提供 grpc 和 rest 服务,同时使用 GPU 复用 +HPA 提高 GPU 利用率 创建 Serving 与训练集成 • 用户只需要简单选择机房和 镜像填写模型名即可完成 Serving 服务创建 自有模型 • 用户只需要填写模型地址即 可 GPU 监控 • 容器监控服务,自适 应 GPU 容器,可根据 容器 IP 查询记录0 码力 | 11 页 | 13.40 MB | 1 年前3
共 11 条
- 1
- 2













