沟通成本 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

B站统⼀监控系统的设计,演进与实践分享

cncf基⾦金金会 metric • 40w+/s的指标采集 • 10k+ 监控⽬目标 • 10+ prometheus节点现状: • 性能 • ⾼高可⽤用 • 分布式 • 使⽤用成本问题: ? 性能问题 • 本地ssd prometheus Shard A prometheus Shard B prometheus Shard C targets hash Federation pr s s s pr I pr s s s pr I IDC1 IDC2 prometheus prometheus filter数据精度降低建议降低使⽤用成本 agent prometheus target target target alert_manager 告警平服务 cache db平台 rms资外围系统监控⽬目规则⽣生 target target target IDC_2 获取  监控⽬目标  告警规则 web push rule push rule 获取监控数据获取监控数据推送告警降低使⽤用成本 agent prometheus target target target alert_manager 告警平服务 cache db平台 rms资外围系统监控⽬目规则⽣生

0 码力 | 34 页 | 650.25 KB | 1 年前
3
PromQL 从入门到精通

的那个请求，其延迟数据是11秒，而这里算出13秒，显然与现实不符，不符也没办法，这本来就是个预估值，知道大概数量级就可以了，还是那句话，监控数据是采样数据，这么计算虽然不是那么准确，但是成本低。实际上，我们基于某个指标的历史所有数据计算分位值，意义不大，通常我们是基于最近一段时间的增量数据来计算，比如基于10分钟区间的增量数据计算，就可以较为方便的知道，当前这个10分钟的延

0 码力 | 16 页 | 2.77 MB | 1 年前
3

共 2 条前往

页

监控系统设计演进实践分享 PromQL Prometheus

分类

语言

格式

B站统⼀监控系统的设计,演进与实践分享

PromQL 从入门到精通

分类

语言

格式

B站统⼀监控系统的设计,演进 与实践分享

PromQL 从入门到精通

B站统⼀监控系统的设计,演进与实践分享