清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单性能之间取得平衡,适合 中等规模任务。 多模态支持:支持文本和 图像处理,扩展应用场景。 可解释性:注重模型输出 的可解释性和透明性。 DeepSeek R1 高效推理:专注于低延迟和 高吞吐量,适合实时应用。 轻量化设计:模型结构优化, 资源占用少,适合边缘设备 和移动端。 多任务支持:支持多种任务, 如文本生成、分类和问答。 Kimi k1.5 垂直领域优化:针对特定领域 负责图表逻辑优化 数据采集 数据预处理 数据分析 可视化呈现 新思路:DeepSeek R1的数据应用 中 文 数 据 处 理 优 势 创 意 写 作 生 成 能 力 数 据 读 取 分 析 能 力 低 成 本 高 性 能 优 势 编 程 代 码 生 成 能 力 • 智 能 中 文 古 籍 修 复 与 注 释 : 利用 DeepSeek R1强大的中文理解能力,自动识 别并修复古籍中的破损文字,同时生成准确的 图示(如文献关键词共现图)直观展示综述内容,帮助 用户更好理解和呈现研究成果。 无数据检索:以现有真实数据库作为支撑,通过关键词 检索,自动搜集相关文献并生成综述报告,目前只支持 英文检索。 低重复率:结合现有查重机制与AI技术,在内容生成阶 段引入重复检测与优化策略,从源头上降低重复率风险, 所生成的综述普通重复率与AIGC重复率均在5%以下。 无限双语数据导入:支持中文与英文文献的导入,并且0 码力 | 85 页 | 8.31 MB | 8 月前3
RocketMQ v3.2.4 开发指南的队列,和一个普通优兇级 的队列, 将丌同优兇级収送到丌同队列即可。 对亍优兇级问题,可以归纳为 2 类 1) 只要达到优兇级目的即可,丌是严格意丿上的优兇级,通常将优兇级划分为高、中、低,戒者再多几个级 别。每个优兇级可以用丌同的 topic 表示,収消息时,挃定丌同的 topic 来表示优兇级,返种方式可以解决 绝大部分的优兇级问题,但是对业务的优兇级精确性做了妥协。 2) Latency Messaging 在消息丌堆积情冴下,消息到达 Broker 后,能立刻到达 Consumer。 RocketMQ 使用长轮询 Pull 方式,可保证消息非常实时,消息实时性丌低亍 Push。 项目开源主页:https://github.com/alibaba/RocketMQ 7 4.8 At least Once 是挃每个消息必须投递一次 RocketMQ CPU,内存安全性控制复杂,需要避免 JVM Crash 问题。 2. 使用 sendfile 方式 优点:可以利用 DMA 方式,消耗 CPU 较少,大块文件传输效率高,无内存安全新问题。 缺点:小块文件效率低亍 mmap 方式,只能是 BIO 方式传输,丌能使用 NIO。 RocketMQ 选择了第一种方式,mmap+write 方式,因为有小块数据传输的需求,效果会比 sendfile 更好。0 码力 | 52 页 | 1.61 MB | 1 年前3
基于go和flutter的实时通信/视频直播解决方案 段维伟GIPS (6800万美金)的高质量实时音视频引 擎 • 支持主流浏览器主流移动设备 • 历时十年成为Web 实时通讯标准 • RTMP 直播协议的低延迟替代方案 WebRTC 可以做什么 02. 副标题 • 用实现网页音/视频通话 • 低延迟直播系统(在线课堂) • 多人视频会议系统 • 高质量SIP/VOIP系统 • 视频监控系统 • 机器学习,视觉计算等 如何使用它 010 码力 | 38 页 | 2.22 MB | 1 年前3
Kubernetes Operator 实践 - MySQL容器化Ø 使用 mysql 半同步复制 Ø 有数据丢失风险 Mysql Group Replication Ø MySQL 官方提供 Ø 5.7 新特性 Ø 基于 Paxos 协议 Ø 写入延迟相对高 MySQL 高可用的实现方式 MHA 高可用简介 • 节点分为 mha-manager、 mha-node • 节点两两间 ssh 免密登录 • 一个 mha-manager 管理多个 数据存储 分布式存储 • 使用 Ceph RBD,基于产品线 创建 StorageClass • 优点:可靠性高,容器漂移时 数据不变 • 缺点:读写延迟较高 本地存储 • 基于 Host Path Volumes • 优点:读写延迟低 • 缺点:单点数据,容器漂移时 数据丢失 踩到的坑 • 现象:执行 docker 命令时,docker daemon 无响应,/var/log/messages0 码力 | 42 页 | 4.77 MB | 1 年前3
清华大学 DeepSeek 从入门到精通理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 问题的每个步骤来得到答案 决策能力 依赖预设算法和规则进行决策 输出格 式 自主优化步骤,兼顾效率 与正确性 严格按指令执行,无自主优化 提示语示例 决策需求 验证性需求 "为降低物流成本,现有两种方案: ①自建区域仓库(初期投入高,长期成本低) ②与第三方合作(按需付费,灵活性高) 请根据ROI计算模型,对比5年内的总成本并推荐最优 解。" �实战技巧: "以下是某论文结论:'神经网络模型A优于传统方法B'。 请验证: 逻辑推理和 抽象能力 典型错误表现 数据误用 有数据 低 高 高 中 误用已有数据,回答 部分不符或细节错误 语境误解 有数据 高 低 高 中 对问题的意图理解错 误,回答偏离主题 信息缺失 无数据 中 高 低 中 未能正确获取或整合 外部信息 推理错误 部分数据 高 高 中 低 逻辑推理中存在漏洞 或错误假设 无中生有 无数据 低 中 低 低 在无数据支持下,生 成完全虚构的信息 AI幻觉:五类七特0 码力 | 103 页 | 5.40 MB | 8 月前3
Apache Pulsar,云原生时代的消息平台 - 翟佳
streamnative.io Apache Pulsar 是什么 streamnative.io Apache Pulsar 要解决的问题 • 企业需求和数据规模 • 多租户 - 百万Topics - 低延时 - 持久化 - 跨地域复制 • 解除存储计算耦合 • 运维痛点:替换机器、服务扩容、数据 rebalance • 减少⽂件系统依赖 • 性能难保障: 持久化(fsync)、⼀致性(ack: all)、多Topic Apache Pulsar 简介 • Pulsar 的云原⽣架构 • 企业级流存储: BookKeeper Apache BookKeeper: 企业级流存储层 分布式⽇志/流存储 • 低延时、⾼吞吐、持久化 • 强⼀致 (repeatable read consistency) • ⾼可⽤ • 单节点可以存储很多⽇志 • I/O隔离 Apache BookKeeper: 诞⽣场景0 码力 | 39 页 | 12.71 MB | 6 月前0.03
MySQL 8.0.17 调优指南(openEuler 20.09)所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。 MySQL所使用的SQL语言是用于访问数据库的最常用标准化语言。MySQL软件采用了 双授权政策,分为社区版和商业版,由于其体积小、速度快、总体拥有成本低,尤其 是开放源码这一特点,一般中小型网站的开发都选择 MySQL作为网站数据库。 1.2 调优原则 性能调优从大的方面来说,在系统设计之初,需要考虑硬件的选择,操作系统的选 择,基础软件的选择; 用编译器的选项,如何发挥硬件最大的性能等等。 在性能优化时,我们必须遵循一定的原则,否则,有可能得不到正确的调优结果。主 要有以下几个方面: ● 对性能进行分析时,要多方面分析系统的资源瓶颈所在,因为系统某一方面性能 低,也许并不是它自己造成的,而是其他方面造成的。如CPU利用率是100%时, 很可能是内存容量太小,因为CPU忙于处理内存调度。 ● 一次只对影响性能的某方面的一个参数进行调整,多个参数同时调整的话,很难0 码力 | 11 页 | 223.31 KB | 1 年前3
JavaScript 正则表达式迷你书 老姚 - v1.1• 惰性量词“试”的策略是:卖东西加价。给少了,再多给点行不,还有点少啊,再给点。 • 分支结构“试”的策略是:货比三家。这家不行,换一家吧,还不行,再换。 既然有回溯的过程,那么匹配效率肯定低一些。相对谁呢?相对那些 DFA 引擎, DFA 是“确定型有限自动 机”的简写。 而 JavaScript 的正则引擎是 NFA,NFA 是“非确定型有限自动机”的简写。 大部分语言中的正则都是 =…)、(?!…)、[…] 2 量词限定符 {m}、{m,n}、{m,}、?、*、+ 3 位置和序列 ^、$、\元字符、一般字符 4 管道符(竖杠) | 5 上面操作符的优先级从上至下,由高到低。 这里,我们来分析一个正则: /ab?(c|de*)+|fg/ • 由于括号的存在,所以,(c|de*) 是一个整体结构。 • 在 (c|de*) 中,注意其中的量词 ,因此 e 是一个整体结构。0 码力 | 89 页 | 3.42 MB | 11 月前3
JavaScript 正则表达式迷你书 老姚 - v1.0• 惰性量词“试”的策略是:卖东西加价。给少了,再多给点行不,还有点少啊,再给点。 • 分支结构“试”的策略是:货比三家。这家不行,换一家吧,还不行,再换。 既然有回溯的过程,那么匹配效率肯定低一些。相对谁呢?相对那些 DFA 引擎, DFA 是“确定型有限自动 机”的简写。 而 JavaScript 的正则引擎是 NFA,NFA 是“非确定型有限自动机”的简写。 大部分语言中的正则都是 =…)、(?!…)、[…] 2 量词限定符 {m}、{m,n}、{m,}、?、*、+ 3 位置和序列 ^、$、\元字符、一般字符 4 管道符(竖杠) | 5 上面操作符的优先级从上至下,由高到低。 这里,我们来分析一个正则: /ab?(c|de*)+|fg/ • 由于括号的存在,所以,(c|de*) 是一个整体结构。 • 在 (c|de*) 中,注意其中的量词 ,因此 e 是一个整体结构。0 码力 | 89 页 | 3.42 MB | 11 月前3
消息中间件RocketMQ原理解析 - 斩秋将消息提交到消费消息服务 ConsumeMessageService 流控处理, 如果 pullInterval 参数大于 0 (拉消息间隔,如果为了降低拉取速度, 可以设置大于 0 的值), 延迟再执行拉消息, 如果 pullInterval 为 0 立刻在执行拉 消息动作 序列图 1. 向 broker 发送长轮询请求0 码力 | 57 页 | 2.39 MB | 1 年前3
共 12 条
- 1
- 2













