清华大学 DeepSeek 从入门到精通剧本或对话设计 文本创作 长文本摘要(论文、报告) 文本简化(降低复杂度) 多语言翻译与本地化 摘要与改写 02 01 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 理) 因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 当人人都会用AI时,你如何用得更好更出彩? 推理模型 • 例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。 推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它 们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。 非推理大模型: 适用于大多数任务,非推理大模型一般侧重于语言生成、上下文理解和自然语言处理,而不强 调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像 推理模型那样复杂的推理和决策能力。 维度 推理模型 通用模型 优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面0 码力 | 103 页 | 5.40 MB | 8 月前3
JavaScript 正则表达式迷你书 老姚 - v1.120 2.4.2 数字的千位分隔符表示法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.4.3. 验证密码问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.5. 本章小结 . . . . . . . . 5.2.1 匹配字符串整体问题. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 5.2.2 量词连缀问题. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 5.2.3 元字符转义问题. . . . . . . . . . . . . . . . . . . . . . 65 7.2.1. search 和 match 的参数问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 7.2.2. match 返回结果的格式问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 660 码力 | 89 页 | 3.42 MB | 11 月前3
JavaScript 正则表达式迷你书 老姚 - v1.020 2.4.2 数字的千位分隔符表示法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.4.3. 验证密码问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.5. 本章小结 . . . . . . . . 5.2.1 匹配字符串整体问题. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 5.2.2 量词连缀问题. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 5.2.3 元字符转义问题. . . . . . . . . . . . . . . . . . . . . . 65 7.2.1. search 和 match 的参数问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 7.2.2. match 返回结果的格式问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 660 码力 | 89 页 | 3.42 MB | 11 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单集社交媒体数据、数据库内容、文本数据、接口数据等。 通过数据清洗、数据集成、数据变换、特征工程等方式,实 现数据纠错、数据整合、格式转换、特征提取等。 对数据进行诊断、预测、关联、聚类分析,常用于问题 定位、需求预测、推荐系统、异常检测等。 对数据进行分类、社交网络分析或时序模式挖掘,常用 于客户细分、信用评分、社交媒体营销、股价预测等。 将数据转化为统计图、热力图、网络关系图、词云、树形 在复杂爬虫任务上,DeepSeek R1与Open AI o3min生成的代码均能正常执行数据采集任务,o3响应速度更快,R1数据采集结果更加完 整准确;其他2个模型都存在多次调试但代码仍然运行不成功的问题,如代码中罗列URL不全、输出文本中提取数据为空等。 Kimi k1.5 能够提取所有网址,代码运 行后生成本地文件,但提取 数据结果为空。 结论 Claude 3.5 sonnet 文本数据集成 一般文本处理任务中,DeepSeek R1所提取的文本数据维度最为全面,但容易受文本长度或模型稳定性影响出现失误;其他三个模型在文本数 据提取过程中,都存在对部分数据的忽略问题,没有完整集成到可视化表格中; 长文本处理任务中,Kimi k1.5相较短文本处理表现更加突出,提取准确的同时数据维度更加全面;由于文本过长DeepSeek R1无法完成任务; 综合来看,Open0 码力 | 85 页 | 8.31 MB | 8 月前3
RocketMQ v3.2.4 开发指南................................................................................ 2 4 消息中间件需要解决哪些问题? ................................................................................................. ................................................................................... 26 7.15 消息堆积问题解决办法 .............................................................................................. 1 1 前言 本文档旨在描述 RocketMQ 的多个关键特性的实现原理,幵对消息中间件遇到的各种问题迕行总结,阐述 RocketMQ 如何解决返些问题。文中主要引用了 JMS 规范不 CORBA Notification 规范,规范为我们设计系统挃明了 方吐,但是仍有丌少问题规范没有提及,对亍消息中间件又至关重要。RocketMQ 幵丌遵循任何规范,但是参考了 各种规范不同类产品的设计思想。0 码力 | 52 页 | 1.61 MB | 1 年前3
Ubuntu 桌面培训 2010的却那么慢? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 497 XI.VII其他问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 439 IX.5 常见问题页面 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 检查并试运行学生和教员的计算机,确保 Ubuntu 在那些机器上能够正常运行。 • 确保您阅读了课室的设备指南,测试实验练习并且解决可能出现的问题。 • 在正式讲课之前阅读教员指南和教学用幻灯片。 34 教员职责 目录 Lucid Lynx • 学生可能由于教学幻灯片内容的局限而无法回答所有问题。请您在提出问题之前确 保您的教学内容已覆盖相关的主题。 • 强烈推荐您教授培训材料中包含的每个主题。当然,如果您的时间有限,每个章节0 码力 | 540 页 | 26.26 MB | 1 年前3
MySQL 8.0.17 调优指南(openEuler 20.09)性能优化首先要较为精准的定位问题,分析系统性能瓶颈,然后根据其性能指标以及 所处层级选择优化的方式方法。 下面介绍MySQL数据库具体的调优思路和分析过程,如图1所示。 调优分析思路如下: 1. 很多情况下压测流量并没有完全进入到服务端,在网络上可能就会出现由于各种 规格(带宽、最大连接数、新建连接数等)限制,导致压测结果达不到预期。 2. 接着看关键指标是否满足要求,如果不满足,需要确定是哪个地方有问题,一般 情况下,服务器端问题可能性比较大,也有可能是客户端问题(这种情况比较 小)。 3. 对于服务器端问题,需要定位的是硬件相关指标,例如CPU,Memory,Disk I/O,Network I/O,如果是某个硬件指标有问题,需要深入的进行分析。 4. 如果硬件指标都没有问题,需要查看数据库相关指标,例如:等待事件、内存命 中率等。 5. 如果以上指标都正常,应用程序的算法、缓冲、缓存、同步或异步可能有问题, 异步可能有问题, 需要具体深入的分析。 瓶颈点 说明 硬件/规格 一般指的是CPU、内存、磁盘I/O方面的问题,分为服务器硬件瓶 颈、网络瓶颈(对局域网可以不考虑)。 操作系统 一般指的是Windows、UNIX、Linux等操作系统。例如,在进行性 能测试,出现物理内存不足时,虚拟内存设置也不合理,虚拟内 存的交换效率就会大大降低,从而导致行为的响应时间大大增 加,这时认为操作系统上出现性能瓶颈。0 码力 | 11 页 | 223.31 KB | 1 年前3
MySQL高可用 - 多种方案2012-09-04 博客地址 http://blog.chinaunix.net/uid/20639775.html 1 前言 Mysql 高可用一直是 mysql 业界不断讨论的热点问题,其中涉及的东西比较多,可 供选择的方案也相当多,面对这么多的方案,我们应该如何选择适合自己公司的 mysql 高可用方案呢,我觉得首先我们需要了解的自己公司的业务,了解在线系统中那些东西 会影响 高可用为了实现 mysql 数据的一致性,一般都是采用单点写入,本方案采用 keepalived 中的 sorry_server 来实现写入数据库为单点的需求。本方案实现的功能是当网络有问题、 mysql 有问题、服务器宕机、keepalived 服务停止后,服务器能自动跳转到备用机, 当主服务器服务启动起来后会自动切换回来。 2.2 方案架构图 2.3 方案优缺点 优点: 数据的一致性,一般都是采用单点写入,本方案采用 keepalived 中的 sorry_server 来实现写入数据库为单点的需求,读负载均衡通过 lvs 实现,读能自由 的实现负载均衡和故障切换。本方案实现的功能是当网络有问题、mysql 有问题、 服务器宕机、keepalived 服务停止后,服务器能自动跳转到备用机,当主服务器服务 启动起来后会自动切换回来。 3.2 方案架构图 3.3 方案优缺点 优点: 0 码力 | 31 页 | 874.28 KB | 1 年前3
2022 Apache Ozone 的最近进展和实践分享Apache Ozone 的最近进展和实 践分享 刘岩 陈怡 2022.07.29 ⽬录 • Apache Hadoop HDFS⾯临的问题 • Apache Ozone介绍 • Apache Ozone适⽤场景 • Apache Ozone的最近进展 • Apache Ozone的实践分享 ⼤数据存储的需求 能否提供⾼并发读取和写⼊ 是否兼容主流API,如HDFS/S3 现有的对象存储⽅案 ⽆法很好的横向扩展 HDFS的扩展性 达到了上限 ⽆法接受私有化 的数据存储系统 公有云的对象存储服务 ⽆法在线下部署 ⽬录 • Apache Hadoop HDFS⾯临的问题 • Apache Ozone介绍 • Apache Ozone适⽤场景 • Apache Ozone的最近进展 • Apache Ozone的实践分享 Apache Ozone • Ozone是 http://localhost:9878 s3://buckettest ozone cli ozone sh volume create /vol1 ⽬录 • Apache Hadoop HDFS⾯临的问题 • Apache Ozone介绍 • Apache Ozone适⽤场景 • Apache Ozone的最近进展 • Apache Ozone的实践分享 Apache Ozone – 使⽤场景0 码力 | 35 页 | 2.57 MB | 1 年前3
强大的音视频处理工具: FFmpegsrt;以及如何⽤Aegisub编辑字幕;从视频中提取字幕、从srt转换出ass 字幕;嵌⼊字幕,包括⽤流拷⻉模式嵌⼊软字幕、⽤vf模式烧录嵌⼊硬字 幕、且可以指定字幕位置、指定字幕⽂字属性等;整理ffmpeg使⽤的⼼得 和常⻅问题;以及其他有哪些⼯具软件⽤到了ffmpeg、如何⽤Python调⽤ ffmpeg;最后给出附录内容,包括help语法、⽂档资料等。 源码+浏览+下载 本书的各种源码、在线浏览地址、多种格式⽂件下载如下: Style: Transparent,PingFang SC,20,&&H00FFFFFF, H00FFFFFF,&&H000000FF, H000000FF,&&HB HB 获取 48 常⻅问题 当导⼊视频时会提示:载⼊视频的分辨率与当前 脚本指定的分辨率不匹配 不要⽤默认选择:直接设为视频分辨率 会导致预览看到的视频很⼩,字幕很⼩ 后续调整字幕的⼤⼩后,预览中视频⾥的字幕仍旧很⼩,导 ffmpeg -i input_video.mp4 -vf "delogo=x=474:y=6:w=162:h=90" "delogo=x=474:y=6:w=162:h=90" 获取 65 没问题。 后台运⾏时: python3 processCourseVideo.py python3 processCourseVideo.py && 结果会卡死。 后来发现:需要给 ffmpeg0 码力 | 73 页 | 11.57 MB | 1 年前3
共 15 条
- 1
- 2













