告警OnCall事件中心建设方法白皮书 # 事件 ONCALL 中心建设方法 一站式处理值班 OnCall,智能降噪  可能有多套)或者 Nightingale,日志的监控可能用的 Elastalert,如果上云了,可能还会有多套不同的云监控(尤其是多云场景下)。 监控系统的重心,通常是采集、存储、可视化、生成告警事件,但通常都不具有完备的事件后续处理能力。这里说的后续处理主要包括:多渠道分级通知、告警静默、抑制、收敛聚合、降噪、排班、认领升级、协同闭环处理等等。监控系统或多或少都有一些这方面的能力,但是通常都不完备,而这,正是PagerDuty 3/af23dd3a5d68a86ba08b082c21337120/p2_1.jpg) 对于告警事件的后续处理,有哪些问题和需求以及何为最佳实践?我们从思路方法和工具实践两个方面分别进行探讨,下面先行探讨思路方法,看看要解决这些问题和需求,我们有哪些可能的解法。 ## 思路方法篇 告警事件的后续处理:多渠道分级通知、告警静默、抑制、收敛聚合、降噪、排班、认领升级、协同闭环处理等等。看起来需求很多,最核心的痛点有两个:0 码力 | 23 页 | 1.75 MB | 2 年前3
探讨和实践基于Istio的微服务治理事件监控# Service Mesh Meetup #4 上海站 探讨和实践基于Istio的微服务治理事件监控 2018.11.25 徐运元 ## 关于我   ..... 641 10 宏 ..... 745 11 用户和用户组 ..... 756 8. Service 服务监控 ..... 776 8. Service monitoring ..... 776 9. Web 监控 ..... 7860 码力 | 1850 页 | 13.52 MB | 1 年前3
Zabbix 5.2 ManualManual Copyright notice 4 附录 4 1 常见问题/疑难解答赵 4 2 安装赵 5 3 后台进程配置 16 4 各种协议 112 5 监控项 148 6 触发器赵 179 7 宏赵 196 8 单位符号说明 236 9 时间段配置 237 10 命令执行 238 11 监控方案 239 12 Performance tuning 241 新建监控项 320 4 新建触发器 322 5 获取问题通知 324 6 新建模版 328 6. Zabbix 应用 330 7. 配置 334 7. Configuration ..... 334 1 主机和主机组 ..... 338 2 监控项 ..... 363 3 触发器 ..... 522 4 事件 ..... 545 5 事件关联 ..... 548 7 模板 ..... 556 8 模板开箱即用 ..... 557 9 事件通知 (ZX) ..... 560 10 宏 ..... 658 11 用户和用户组 ..... 665 8. Service 服务监控 [ZeMing] ..... 685 8. Service monitoring ..... 685 9. Web 监控 [ZeMing] ..... 6950 码力 | 1725 页 | 11.53 MB | 2 年前3
The Svelte Handbook
0 码力 | 44 页 | 2.01 MB | 2 年前3
Graph streaming algorithms - CS 591 K1: Data Stream Processing and Analytics Spring 20200 码力 | 72 页 | 7.77 MB | 2 年前3
GSoC 2020 Apache Proposal
Apache RocketMQ Scaler for KEDA0 码力 | 7 页 | 140.48 KB | 1 年前3
OpenMetrics - Standing on the shoulders of Titans0 码力 | 21 页 | 84.83 KB | 1 年前3
共 896 条
- 1
- 2
- 3
- 4
- 5
- 6
- 90













