PromQL 从入门到精通磁盘利用率大于70%就告警,对于盘不大的情况是适用的,如果盘太大,比如16T一块盘,使用 率70%还有非常大的余量,所以这里我们使用and附加一个条件,限制一下disk_total,即磁盘 总大小,磁盘总大小小于500GB,才适用磁盘利用率大于70%这个规则。 or vector1 or vector2,其结果是一个向量,包含vector1的所有原始元素(标签集+值)以及 vector2中所 函数,increase 函数是求取的时间段内的增量,而且有数据外推,rate 函数则求取的每秒变化率,也有数据外推的逻辑,相当于 increase 的结果除以 range-vector 的时间段的大小,就是 rate 的值。我们用如下 promql 做验证: rate(net_bytes_recv{interface="eth0"}[1m]) == bool increase(net_by 求,可能恰好是暴露问题的200个请求。 所以在看延迟数据时,我们通常会用分位值,比如99分位,90分位,50分位,所谓的分位值, 就是把一段时间内的所有延迟数据从小到大排序,99分位就是看第99%位置的那个值的大小。 还是上面的例子,平均响应时间是1.18秒,但是99分位时间是10秒,相差巨大,更容易暴露问 题。这里所谓的99分位延迟10秒,可以理解为,99%的请求都在10秒内返回。 从监控系统角度,如0 码力 | 16 页 | 2.77 MB | 1 年前3
共 1 条
- 1
相关搜索词













