清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单
能做什么? 要怎么做? 效果如何? 一 能做什么? 数据挖掘 数据分析 数据采集 数据处理 数据可视化 AIGC 数据应用 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采 集社交媒体数据、数据库内容、文本数据、接口数据等。 通过数据清洗、数据集成、数据变换、特征工程等方式,实 现数据纠错、数据整合、格式转换、特征提取等。 对数据进行诊断、预测、关联、聚类分析,常用于问题 对数据进行诊断、预测、关联、聚类分析,常用于问题 定位、需求预测、推荐系统、异常检测等。 对数据进行分类、社交网络分析或时序模式挖掘,常用 于客户细分、信用评分、社交媒体营销、股价预测等。 将数据转化为统计图、热力图、网络关系图、词云、树形 图等,用于揭示数据中蕴含的模式、趋势、异常和洞见。 本质:以多agent实现从数据采集到可视全流程 模型特点 Claude 3.5 sonnet 平衡性能:在模型大小和 性能之间取得平衡,适合 Levings1981; Murdoch and Oaten, 1975). 一些因子,如: 捕食者规格 (Ener和Hughes,1978)、栖息 环境复杂程度等都会影响捕食进而影响捕食者与猎物之间的动 态关系。 Some factors, such as predator size (Elner andHughes, 1978) and habitat complexity, can affectpredation0 码力 | 85 页 | 8.31 MB | 7 月前3MySQL 8.0.17 调优指南(openEuler 20.09)
MySQL 介绍 MySQL是一个关系型数据库管理系统,由瑞典MySQL AB公司开发,目前属于Oracle 旗下产品。MySQL是最流行的关系型数据库管理系统之一,在Web应用方面,MySQL 是最好的RDBMS (Relational Database Management System,关系数据库管理系 统)应用软件之一。 MySQL是一种关系数据库管理系统,关系数据库将数据保存在不同的表中,而不是将 所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。 MySQL所使用的SQL语言是用于访问数据库的最常用标准化语言。MySQL软件采用了 双授权政策,分为社区版和商业版,由于其体积小、速度快、总体拥有成本低,尤其 是开放源码这一特点,一般中小型网站的开发都选择 MySQL作为网站数据库。 1.2 调优原则 性能调优从大的方面来说,在系统设计之初,需要考虑硬件的选择,操作系统的选 择 性能调优不能以牺牲代码的可读性和可维护性为代价。 1.3 调优思路 性能优化首先要较为精准的定位问题,分析系统性能瓶颈,然后根据其性能指标以及 所处层级选择优化的方式方法。 下面介绍MySQL数据库具体的调优思路和分析过程,如图1所示。 调优分析思路如下: 1. 很多情况下压测流量并没有完全进入到服务端,在网络上可能就会出现由于各种 规格(带宽、最大连接数、新建连接数等)限制,导致压测结果达不到预期。0 码力 | 11 页 | 223.31 KB | 1 年前3Ubuntu 桌面培训 2010
OpenOffice.org 演示 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 IV.I.IV OpenOffice.org 数据库 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 目录 5 Ubuntu 桌面培训 目录 IV.I.V OpenOffice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486 XI.II.II 无法连接互联网的环境中,如何下载多个软件,并解 决依赖关系? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 487 目录 9 Ubuntu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 499 XI.IX.II Ubuntu 与 Debian 的关系 . . . . . . . . . . . . . . . . . . . . . . . . . . . 500 XI.IX.IIIUbuntu 与其他基于 Ubuntu 的衍生发行版 . .0 码力 | 540 页 | 26.26 MB | 1 年前3RocketMQ v3.2.4 开发指南
大降低。 如果服务器部署为同步双写模式,此缺陷可通过备机自劢切换为主避免,丌过仍然会存在几分钟的服务丌 可用。(依赖同步双写,主备自劢切换,自劢切换功能目前迓未实现) 目前已知的应用只有数据库 binlog 同步强依赖严格顺序消息,其他应用绝大部分都可以容忍短暂乱序,推 荐使用普通的顺序消息。 Message Queue 项目开源主页:https://github.com/alibaba/RocketMQ 返种过滤方式可由应用完全自定丿实现,但是缺点是很多无用的消息要传输到 Consumer 端。 4.5 Message Persistence 消息中间件通常采用的几种持丽化方式: (1). 持丽化到数据库,例如 Mysql。 (2). 持丽化到 KV 存储,例如 levelDB、伯克利 DB 等 KV 存储系统。 (3). 文件记彔形式持丽化,例如 Kafka,RocketMQ 项目开源主页:https://github Consumer 是否会叐影响? (4). 消息堆积后,访问堆积在磁盘的消息时,吞吏量有多大? 4.13 分布式事务 已知的几个分布式事务规范,如 XA,JTA 等。其中 XA 规范被各大数据库厂商广泛支持,如 Oracle,Mysql 等。 其中 XA 的 TM 实现佼佼者如 Oracle Tuxedo,在金融、电信等领域被广泛应用。 分布式事务涉及到两阶段提交问题,在数据存储方面的方面必然需要0 码力 | 52 页 | 1.61 MB | 1 年前3清华大学 DeepSeek 从入门到精通
1. 决策需求 需权衡选项、评估风险、 选择最优解 目标 + 选项 + 评估标准 要求逻辑推演和量化分析 直接建议,依赖模型经验归纳 2. 分析需求 需深度理解数据/信息、 发现模式或因果关系 问题 + 数据/信息 + 分析 方法 触发因果链推导与假设验 证 表层总结或分类 3. 创造性需求 需生成新颖内容(文本/ 设计/方案) 主题 + 风格/约束 + 创新 方向 AI输出的要求 和预期。 提示语类型 提示语的本质 1. 指令型提示语:直接告诉AI需要执行的任务。 2. 问答型提示语:向AI提出问题,期望得到相应的 答案。 3. 角色扮演型提示语:要求AI扮演特定角色,模拟 特定场景。 4. 创意型提示语:引导AI进行创意写作或内容生成。 5. 分析型提示语:要求AI对给定信息进行分析和推 理。 6. 多模态提示语:结合文本、图像等多种形式的 将这个复杂的主题分解为几个主要部分,逐一讨论每个部分。 2. 对每个子任务设定具体目标和预期成果。 3. 在每个子任务完成后,总结其关键点并与整体主题关联。 4. 通过层次结构图或思维导图展示分解后的各部分及其关系。 5. 结合各部分的结果,撰写一段总结性内容,确保整体连贯。 �实战技巧: • 任务分解 • 结果整合 • 问题定义 • 信息收集 • 分析综合 • 结论形成 1. 明确这个问题0 码力 | 103 页 | 5.40 MB | 8 月前32022 Apache Ozone 的最近进展和实践分享
Ozone的实践分享 Apache Ozone • Ozone是 ⼀个分布式的KV对象存储 可扩展⾄数⼗亿个对象,从⽽对云原⽣类的应⽤更友好 强⼀致性 与HDFS 和 S3 API兼容 可在存储密集型设备中部署进⽽极⼤的减少设备开⽀ Apache Ozone – 数据存储的路径设计 Ozone的存储路径为 volumes, buckets, 和 keys. Volumes 类似与⽤户账号. 只有Admin 可以创建或删除Volumes Buckets 类似与S3 的 Buckets, ⼀个Buckets中可以包含任意多个Key,但不能包含其 他Buckets Keys 类似于⽂件. ⽂件系统的层级关系是通过扁平的KV路径抽象实现的 Apache Ozone – 数据服务的核⼼设计 Apache Ozone – 数据服务的核⼼设计 1. OM – 管理Ozone的Namespace ,也使⽤了RocksDB 监控Ozone集群 4. DataNode – 负责存储和汇报Storage Containers 5. Storage Containers – Ozone的存储单元,内置有RocksDB 数据库 Apache Ozone – 数据访问的API ofs hdfs dfs -mkdir /volume1/bucket1 o3fs hdfs dfs -ls o3fs://bucket0 码力 | 35 页 | 2.57 MB | 1 年前3JavaScript 正则表达式迷你书 老姚 - v1.1
. . . . 58 6.4.1. 使用具体型字符组来代替通配符,来消除回溯 . . . . . . . . . . . . . . . . . . . . 59 6.4.2. 使用非捕获型分组 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.4.3. 独立出确定字符 . . . . . . . 我们可以把原题变成下列几种情况之一: • 同时包含数字和小写字母 • 同时包含数字和大写字母 • 同时包含小写字母和大写字母 • 同时包含数字、小写字母和大写字母 • 以上的 4 种情况是或的关系(实际上,可以不用第 4 条)。 最终答案是: var regex = /((?=.*[0-9])(?=.*[a-z])|(?=.*[0-9])(?=.*[A-Z])|(?=.*[a-z])(?= console.log( regex.test("12345 5") ); // => true 3.4. 非捕获括号 之前文中出现的括号,都会捕获它们匹配到的数据,以便后续引用,因此也称它们是捕获型分组和捕获型分 支。 如果只想要括号最原始的功能,但不会引用它,即,既不在 API 里引用,也不在正则里反向引用。 此时可以使用非捕获括号 (?:p) 和 (?:p1|p2|p3),例如本章第一个例子可以修改为:0 码力 | 89 页 | 3.42 MB | 10 月前3JavaScript 正则表达式迷你书 老姚 - v1.0
. . . . 58 6.4.1. 使用具体型字符组来代替通配符,来消除回溯 . . . . . . . . . . . . . . . . . . . . 59 6.4.2. 使用非捕获型分组 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.4.3. 独立出确定字符 . . . . . . . 我们可以把原题变成下列几种情况之一: • 同时包含数字和小写字母 • 同时包含数字和大写字母 • 同时包含小写字母和大写字母 • 同时包含数字、小写字母和大写字母 • 以上的 4 种情况是或的关系(实际上,可以不用第 4 条)。 最终答案是: var regex = /((?=.*[0-9])(?=.*[a-z])|(?=.*[0-9])(?=.*[A-Z])|(?=.*[a-z])(?= console.log( regex.test("12345 5") ); // => true 3.4. 非捕获括号 之前文中出现的括号,都会捕获它们匹配到的数据,以便后续引用,因此也称它们是捕获型分组和捕获型分 支。 如果只想要括号最原始的功能,但不会引用它,即,既不在 API 里引用,也不在正则里反向引用。 此时可以使用非捕获括号 (?:p) 和 (?:p1|p2|p3),例如本章第一个例子可以修改为:0 码力 | 89 页 | 3.42 MB | 10 月前3谈谈MYSQL那点事
互联网常用数据库市场占有率 互联网通用架构体制 谈谈 MySQL 数据库那些事 MySQL MySQL 基本介绍 基本介绍 MySQL MySQL 优化方式 优化方式 MySQL MySQL 技巧分享 技巧分享 Q Q & & AA MyISAM MyISAM 特点 特点 MyISAM vs MyISAM vs InnoDB InnoDB • 数据存储方式简单,使用 Windows) Windows) • 访问速度飞快,是所有 访问速度飞快,是所有 MySQL MySQL 文件引擎中速度最快的 文件引擎中速度最快的 • 不支持一些数据库特性,比如 事务、外键约束等 不支持一些数据库特性,比如 事务、外键约束等 • Table level lock Table level lock ,性能稍差,更适合读取多的操作 ,性能稍差,更适合读取多的操作 InnoDB Space 的方式来进行数据存储 的方式来进行数据存储 (ibdata1, ib_logfile0) (ibdata1, ib_logfile0) • 支持 事务、外键约束等数据库特性 支持 事务、外键约束等数据库特性 • Rows level lock , Rows level lock , 读写性能都非常优秀 读写性能都非常优秀 • 能够承载大数据量的存储和访问 能够承载大数据量的存储和访问0 码力 | 38 页 | 2.04 MB | 1 年前3消息中间件RocketMQ原理解析 - 斩秋
一:consumer 启动流程 指定 group 订阅 topic 注册消息监听处理器,当消息到来时消费消息 消费端 Start 复制订阅关系 初始化 rebalance 变量 构建 offsetStore 消费进度存储对象 启动消费消息服务 向 mqClientFactory 注册本消费者 启动 client nameserver 地址 定时从 nameserver 获取 topic 路由信息 定时清理下线的 borker 定时向所有 broker 发送心跳信息,(包括订阅关系) 定时持久化 Consumer 消费进度(广播存储到本地,集群存储到 Broker) 统计信息打点 动态调整消费线程池 启动拉消息服务 PullMessageService PullMessageService 启动消费端负载均衡服务 RebalanceService 从 namesrv 更新 topic 路由信息 向所有 broker 发送心跳信息,(包括订阅关系) 唤醒 Rebalance 服务线程 二:消费端负载均衡 消费端会通过 RebalanceService 线程,10 秒钟做一次基于0 码力 | 57 页 | 2.39 MB | 1 年前3
共 12 条
- 1
- 2