B站统⼀监控系统的设计,演进
与实践分享meta信息 获取业务信息 获取关联关系 告警统计 有意思的尝试 科学的告警策略略 科学? machine learning? deep learning? 不不要盲⽬目的使⽤用机器器学习 先让告警有意义 可读的 • 时间 • 源头 • 规则 • 影响 • 状态 正确的 有价值的 • 发现问题 • 正确反映现实 案例例1 告警规则: 业务A 慢请求量量 >0 码力 | 34 页 | 650.25 KB | 1 年前3
PromQL 从入门到精通、count_eq_over_time 道理相同。 小结 上面的知识点是 PromQL 的常规知识,尽量融入了一些生产实践的场景,当然,PromQL 还有 更多函数没有介绍,大家可以阅读其文档学习。 我是来自快猫星云(https://flashcat.cloud/)的秦晓辉,在监控/可观测性道路上,伴你前行 :-)0 码力 | 16 页 | 2.77 MB | 1 年前3
共 2 条
- 1













