Apache Pulsar,云原生时代的消息平台 - 翟佳
Apache Pulsar 是什么 streamnative.io Apache Pulsar 要解决的问题 • 企业需求和数据规模 • 多租户 - 百万Topics - 低延时 - 持久化 - 跨地域复制 • 解除存储计算耦合 • 运维痛点:替换机器、服务扩容、数据 rebalance • 减少⽂件系统依赖 • 性能难保障: 持久化(fsync)、⼀致性(ack: all)、多Topic • • 企业级流存储: BookKeeper streamnative.io Pulsar: 云原⽣的架构 —— 分层 + 分⽚ • 存储和计算分离 • 节点对等 • 独⽴扩展 • 灵活扩容 • 快速容错 streamnative.io Broker 容错 ⽆感知容错 零数据catchup streamnative.io Bookie容错 应⽤⽆感知 并发可控 数据恢复 streamnative 应⽤⽆感知 数据均匀分布 ⽆re-balance Pulsar: 云原⽣的架构优势 https://jack-vanlightly.com/sketches/2018/10/2/kafka-vs-pulsar-rebalancing-sketch • Pulsar 的根本不同 • Apache Pulsar 简介 • Pulsar 的云原⽣架构 • 企业级流存储: BookKeeper0 码力 | 39 页 | 12.71 MB | 6 月前0.03
强大的音视频处理工具: FFmpeg⾳频⽚段;字幕相关 处理,包括字幕的背景知识,包括软字幕和硬字幕、常⻅字幕格式ass和 srt;以及如何⽤Aegisub编辑字幕;从视频中提取字幕、从srt转换出ass 字幕;嵌⼊字幕,包括⽤流拷⻉模式嵌⼊软字幕、⽤vf模式烧录嵌⼊硬字 幕、且可以指定字幕位置、指定字幕⽂字属性等;整理ffmpeg使⽤的⼼得 和常⻅问题;以及其他有哪些⼯具软件⽤到了ffmpeg、如何⽤Python调⽤ 通过: ffmpeg -i xxx.mp4 ffmpeg -i xxx.mp4 即可看到mp4视频的信息,其中包括了字幕的信息: 其中: Stream #0:2 :字幕也是⼀个stream流,index是0:2 zho :(应该)表示是中⽂ mov_text :后来才听说,好像指的是 Apple Mov Text 格式的? 举例1 ffprobe -v error -select_streams 需经过播放器处理解析显示(=VSFilter渲染) 外挂字幕 以单独的字幕⽂件形式存在,播放时经播放器处理解析 显示(=VSFilter渲染)到视频上 硬字幕=内嵌字幕 指字幕被以图形⽅式硬编码到视频中 变成视频数据本身=视频数据的⼀部分 特点 过程不可逆 ⽆法再把字幕提取出来 播放时不需要额外的播放器读取解析显示(=VSFilter渲染) 字幕 crifan.com,使⽤署名4.0国际(CC BY 4.0)协议发布0 码力 | 73 页 | 11.57 MB | 1 年前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单要怎么做? 效果如何? 一 能做什么? 数据挖掘 数据分析 数据采集 数据处理 数据可视化 AIGC 数据应用 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采 集社交媒体数据、数据库内容、文本数据、接口数据等。 通过数据清洗、数据集成、数据变换、特征工程等方式,实 现数据纠错、数据整合、格式转换、特征提取等。 对数据进行诊断、预测、关联、聚类分析,常用于问题 定位、需求预测、推荐系统、异常检测等。 定位、需求预测、推荐系统、异常检测等。 对数据进行分类、社交网络分析或时序模式挖掘,常用 于客户细分、信用评分、社交媒体营销、股价预测等。 将数据转化为统计图、热力图、网络关系图、词云、树形 图等,用于揭示数据中蕴含的模式、趋势、异常和洞见。 本质:以多agent实现从数据采集到可视全流程 模型特点 Claude 3.5 sonnet 平衡性能:在模型大小和 性能之间取得平衡,适合 mini 小型化设计:轻量级模型, 适合资源有限的环境。 快速响应:优化推理速度, 适合实时交互场景。 通用性强:适用于多种自 然语言处理任务,如对话 生成和文本理解。 爬虫数据采集 1、阅读网页源代码,提取特定网页内容; 2、撰写python脚本; 3、提取并合并网址; 4、提取网址内容; 5、写入文件。 任务 你需要完成以下两个任务: 1.阅读网页【网址】源代码【对应网页源代码】。提取所0 码力 | 85 页 | 8.31 MB | 8 月前3
Ubuntu 桌面培训 2010OpenOffice.org 演示 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 IV.I.IV OpenOffice.org 数据库 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 目录 5 Ubuntu 桌面培训 目录 IV.I.V OpenOffice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391 VIII.56编辑新音乐文件的元数据 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392 VIII.57导出进度指示器 目录 Lucid Lynx 图 I.2 开 放 源 码 运 动 的 发 起 者 开 放 源 码 运 动 和 1990 年 代 末 的 互 联 网 的 兴 起 一 起 造 就 了 Linux 的 流 行 , 随 后 出 现 了 很 多 支 持 开 源 的 公 司 , 如 Corel (Corel Linux) 、Sun Microsystems (OpenOffice.org)、IBM (OpenAFS)。在0 码力 | 540 页 | 26.26 MB | 1 年前3
清华大学 DeepSeek 从入门到精通们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。 非推理大模型: 适用于大多数任务,非推理大模型一般侧重于语言生成、上下文理解和自然语言处理,而不强 调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像 推理模型那样复杂的推理和决策能力。 维度 推理模型 通用模型 优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 问题的每个步骤来得到答案 决策能力 依赖预设算法和规则进行决策 能够自主分析情况,实时做出决策 创造力 通用模型适配策略 1. 决策需求 需权衡选项、评估风险、 选择最优解 目标 + 选项 + 评估标准 要求逻辑推演和量化分析 直接建议,依赖模型经验归纳 2. 分析需求 需深度理解数据/信息、 发现模式或因果关系 问题 + 数据/信息 + 分析 方法 触发因果链推导与假设验 证 表层总结或分类 3. 创造性需求 需生成新颖内容(文本/ 设计/方案) 主题 + 风格/约束 + 创新 方向0 码力 | 103 页 | 5.40 MB | 9 月前3
基于go和flutter的实时通信/视频直播解决方案 段维伟(ios/android/c++) • 使用第三方堆栈实现兼容功能(Go) https://github.com/pion/webrtc 一对一视频原理 基本通讯流程 5 RTP/RTCP/媒体流 1 Offer 信令服务器 2 Offer 3 Answer 4 Answer SDP(Session Description Protocol) v=0 o=mozilla...THIS_IS_SDPARTA-82 存储媒体流全局位置 • 支持业务自定义开发 • 高性能,单个ion-sfu节点 1k 并发仅需 0.5核 ION 架构 多node 架构 主要模块 • ISLB 服务发现,负载均衡,媒体信息全局存储 • Biz 业务接入模块 • SFU 节点 (用于转发webrtc 流,与biz模块配合创建视频会议系 统) • AVP 节点 (用于从SFU节点拉取数据进行数据处理,视频流存 储,音视频混合,CV 网关节点与go-sip stack 或rtmp/hls/srt等协议组合成协议网关 • 转换RTC流成直播流推送到CDN ION客户端支持 • Ion-sdk-js 网页端SDK • Ion-sdk-flutter 全平台flutter SDK • Ion-sdk-go 用于开发推流工具,压力测试,avp 节点开发 • Ion-app-web • Ion-app-flutter0 码力 | 38 页 | 2.22 MB | 1 年前3
Kubernetes Operator 实践 - MySQL容器化服务多迭代快 搜狗产品矩阵 商业平台 信息流广告 搜索广告 品牌广告 代理商 广告主 技术体系 CRM 广告平台 物料展现 审核平台 大数据平台 基础架构 Golang C++ JavaScript Java Python 质量要求高 业务响应快 故障恢复快 Cluster1 搜狗商业平台业务系统 搜索推广 信息流 品牌 BizNginx (Load Balancer) MySQL-Operator 集群管理 Master High Availability Ø 目前最常用的高可用实现 Ø 支持大多数 MySQL 版本 Ø 使用 mysql 半同步复制 Ø 有数据丢失风险 Mysql Group Replication Ø MySQL 官方提供 Ø 5.7 新特性 Ø 基于 Paxos 协议 Ø 写入延迟相对高 MySQL 高可用的实现方式 MHA pod Ceph MySQL-Operator 数据存储 分布式存储 • 使用 Ceph RBD,基于产品线 创建 StorageClass • 优点:可靠性高,容器漂移时 数据不变 • 缺点:读写延迟较高 本地存储 • 基于 Host Path Volumes • 优点:读写延迟低 • 缺点:单点数据,容器漂移时 数据丢失 踩到的坑 • 现象:执行 docker 命令时,docker0 码力 | 42 页 | 4.77 MB | 1 年前3
基于 KUBERNETES 的 容器器 + AI 平台com/caicloud/cyclone Cyclone 技术架构 云原⽣生 CI/CD 引擎 设计 - 云原⽣生,k8s 亲和性 性能 - 为企业场景优化 扩展性 - ⽀支持 AI ⼯工作流 运⾏行行 AI 应⽤用 KUBEFLOW 的应⽤用 • Kubeflow 社区的联合创始⼈人 • kubeflow/tf-operator • 定义 TFJob Spec (CRD) 任务运⾏行行状态 • ⽀支持分布式 TensorFlow 任务 KUBEFLOW 之上 • 借⼒力力容器器平台提供⽣生产级的集群资源管理理 • ⼯工作区隔离与共享 • 数据、模型、环境、应⽤用等 • 全⾯面⽀支持 AI ⼯工作流 • 探索开发 • 线上运⾏行行 关注并回复 kubecon18 P7 展台0 码力 | 19 页 | 3.55 MB | 1 年前3
消息中间件RocketMQ原理解析 - 斩秋et, storeTimestamp。 2.2.3 事物状态表 事物状态表是有 MapedFileQueue 将多个文件组成一个连续的队列,它的存储单元是定 长为 24 个字节的数据, tranStateTableOffset 可以认为是事物状态消息的个数,索引偏移量, 它的值是 tranStateTable.getMaxOffset() / TSStoreUnitSize processqueue 才能被执行消费 rollback: 将消费在 msgTreeMapTemp 中的消息,放回 msgTreeMap 重新消费 commit: 将临时表 msgTreeMapTemp 数据清空,代表消费完成,放回最大偏移 值 (3) 这里是个 TreeMap,对 key 即消息的 offset 进行排序,这个样可以使得消息进 行顺序消费 消息中放入队列最大最小 offset, 方便应用来感知消息堆积度 将消息加入正在处理队列 ProcessQueue 将消息提交到消费消息服务 ConsumeMessageService 流控处理, 如果 pullInterval 参数大于 0 (拉消息间隔,如果为了降低拉取速度, 可以设置大于 0 的值), 延迟再执行拉消息, 如果 pullInterval 为 0 立刻在执行拉 消息动作0 码力 | 57 页 | 2.39 MB | 1 年前3
RocketMQ v3.2.4 开发指南........................................................................................ 14 6.3 数据存储结构 .............................................................................................. ........................................................................................ 15 6.5 数据可靠性 ............................................................................................... ............................................................................... 34 11.3 Message 数据结构 ................................................................................................0 码力 | 52 页 | 1.61 MB | 1 年前3
共 18 条
- 1
- 2













