1.6 利用夜莺扩展能力打造全方位监控系统利用夜莺扩展能力打造全方位监控系统  喻波 滴滴 专家工程师  运维监控需求来源 01 01 监控痛点:全面完备、跨云 02 夜莺介绍:国产开源监控系统 03 夜莺设计实现:Agentd 数据采集 04 夜莺设计实现:Server 数据处理 05 夜莺设计实现:技术难点及细节 06 ## 第一部分 运维监控需求来源 如果贵司的业务强依赖IT技术,IT故障会直接影响营业收入, 稳定性体系一定要重视起来,而监控,就是稳定性体系中至 关重要的一环 ## 运维监控需求来源 个互联网! 2018年有美国调研机构指出,如果服务器宕机1分钟,银行会损失27万美元,制造业会损失42万美元 美团故障?滴滴故障?腾讯故障? ## 运维监控需求来源 如何减少服务停摆导致的经济损失?尽快发现故障并止损!故障处理过程中,监控是『发现』和『定位』两个环节的关键工具。故障处理过程的首要原则是『止损』,因此,过程中的『发现』和『定位』都是面向尽快『止损』来实现。  ## 故事的开始 B站炸了 B站炸了.舆情监控(括弧笑脸) 大家正在搜:池昌旭 林允儿  ★ Lv9 海外 日本 丧偶 2009年6月26日 简介:知识就是力量,法国就是培根,B站就是爆炸。 ## 我们的挑战 ## 当前情况: - 技术栈多 - 产品模块复杂 产品模块复杂 • 业务爆发式增长 • 运维要求高 监控问题爆发: • 覆盖率低 - 误报,漏报多 • 告警风暴  ## 重新定义的监控系统 完整的监控体系  ## 拥抱云原生和开源系统  监控架构概览 01 如何监控 Go 应用? 02 Metrics 系统架构演进 03 Why VictoriaMetrics so good? 04 总结与展望 05 ## 第一部分 监控架构概览 ## 监控系统架构概览 -- 数据源  Google Cloud Grafana new relic ## 监控系统架构概览 -- 告警通道 ## PagerDuty slack ## 第二部分 ## 如何监控 Go 应用?0 码力 | 42 页 | 2.32 MB | 2 年前3
OpenShift Container Platform 4.10 监控p1_1.jpg) # OpenShift Container Platform 4.10 ## 监控 在 OpenShift Container Platform 中配置和使用监控堆栈 100% FREE! 在 OpenShift Container Platform 中配置和使用监控堆栈 ## 法律通告 Copyright © 2023 Red Hat, Inc. The text Container Platform 中配置和使用 Prometheus 监控堆栈的说明。 ## 目录 第1章 监控概述 ..... 4 1.1. 关于 OPENSHIFT CONTAINER PLATFORM 监控 ..... 4 1.2. 了解监控堆栈 ..... 4 1.3. OPENSHIFT CONTAINER PLATFORM 监控的常见术语表 ..... 8 1.4. 其他资源 .. . 10 第2章 配置监控堆栈 ..... 11 2.1. 先决条件 ..... 11 2.2. 对监控的维护和支持 ..... 11 2.3. 准备配置监控堆栈 ..... 12 2.4. 配置监控堆栈 ..... 14 2.5. 可配置的监控组件 ..... 16 2.6. 使用节点选择器移动监控组件 ..... 17 2.7. 为监控组件分配容忍(TOLERATIONS)0 码力 | 135 页 | 1.58 MB | 2 年前3
主从监控项经验分享ZABBIX 2020 Conference CHINA ## 演讲主题 主从监控项经验分享 演讲嘉宾 伍昕 宏时数据 ## 01 ## 主从监控项简介 ## Zabbix的一个使用场景 场景: Zabbix的一次数据采集可能获取多个值,(比如与第三方系统对接,获取数据库所有状态) show global variables;  Zabbix server ## 主从监控项 ## Dependent Items ## http://exporter_ip:9100/metrics ## ← → C A 不安全 | 100/metrics  监控项 DEPENDENT ITEM 第二步: 数据预处理 PREPROCESSING ## 主监控项准备 Dependent Items 创建一个自定义监控项: 修改配置agent0 码力 | 26 页 | 3.92 MB | 2 年前3
OpenShift Container Platform 4.14 电源监控.jpg) ### OpenShift Container Platform 4.14 ## 电源监控 为 Red Hat OpenShift 配置和使用电源监控 Powered by TCPDF (www.tcpdf.org) 为 Red Hat OpenShift 配置和使用电源监控 ## 法律通告 Copyright $ ^{©} $ 2024 Red Hat, Inc. The 您可以使用电源监控来监控 OpenShift Container Platform 集群中运行的每个容器的功耗,如 CPU 和 DRAM。 ## 目录 第1章 RED HAT OPENSHIFT 发行注记 ..... 3 1.1. 电源监控 0.1(技术预览) ..... 3 第2章 电源监控概述 ..... 4 2.1. 关于电源监控 ..... 4 2.2. 电源监控架构 ... OPENSHIFT 安装电源监控 ..... 6 3.1. 安装 POWER 监控 OPERATOR ..... 6 3.2. 部署 KEPLER ..... 6 第4章 配置电源监控 ..... 8 4.1. KEPLER 配置 ..... 8 4.2. 监控 KEPLER 状态 ..... 9 第5章 视觉化电源监控指标 ..... 11 5.1. 电源监控仪表板概述 ...0 码力 | 20 页 | 350.27 KB | 2 年前3
统一建模语言 UML 参考手册 - 基本概念统一建模语言参考手册 —基本概念  翻译: Adams Wang # The Unified Modeling Language Reference Manual James Rumbaugh Ivar Jacobson Grady Grady Booch Powered by TCPDF (www.tcpdf.org) ## 译者序 统一建模语言(UML)是一种直观化、明确化、构建和文档化软件系统产物的通用可视化建模语言。UML 由面向对象领域的三位大师:Grady Booch、Jim Rumbaugh 和 Ivar Jacobson 于 1996 年发布,并提交给 OMG。UML 于 11 月为 OMG 所采用,现已成为业界标准。 模型管理视图(MODEL MANAGEMENT VIEW).....59 概述.....59 包.....59 包的依赖.....59 访问和引入依赖.....60 模型和子系统.....61 扩展机制(Extension Mechanisms).....63 概述.....63 约束.....63 标签值.....64 版型.0 码力 | 123 页 | 2.61 MB | 2 年前3
监控Apache Flink应用程序(入门)# 监控Apache Flink应用程序(入门) caolei Exported on 01/10/2020 ## Table of Contents 1 Flink指标体系 ..... 5 1.1 Metrics ..... 5 1.2 MetricsReporters ..... 5 2 健康状况 ..... 6 3 监控 ..... 7 3.1 关键指标 ..... 7 3.2 仪表盘示例 ..... 8 3.3 可能的报警条件 ..... 9 4 进度和吞吐量监控 ..... 10 4.1 吞吐量 ..... 10 4.2 关键指标 ..... 10 4.3 仪表盘示例 ..... 11 4.4 可能的报警条件 ..... 11 4.5 进度 ..... 12 4.6 关键指标 ..... 12 4.7 仪表盘示例 com/blog/monitoring-apache-flink-applications-101 这篇博文介绍了Apache Flink内置的监控和度量系统,通过该系统,开发人员可以有效地监控他们的Flink作业。通常,对于一个刚刚开始使用Apache Flink进行流处理的DevOps团队来说,选择对应的指标来监控Flink应用程序是非常艰巨的。在与许多大规模部署过Apache Flink的组织合作之后,我想与社区的朋友们分享下我的经验及一些最佳实践。0 码力 | 23 页 | 148.62 KB | 2 年前3
使⽤Apache SkyWalking APM 监控 Apache ServiceComb使用Apache SkyWalking APM 监控 Apache ServiceComb 吴晟 Sheng Wu Huawei DevCloud http://skywalking.io Twitter @AsfSkyWalking Skywalking ## 个人介绍 * GitHub: https://github.com/wu-sheng * Personal Homepage: ## 2017 ·探针与后端的协议重构:为后端分析而生 · 后端重构:提供链路数据的分析和分类聚合 • 界面重构:提供一个APM系统最基本的能力(应用拓扑图、链路展示、服务关系依赖、JVM统计指标) ## 2018 • 界面重构:比肩甚至超越商业APM系统的界面 • 探针:其他语言的支持(Php,Pthon,Go...) • 后端:通过GraphQL将前后端接口协议化,更丰富的统计指 _1.jpg) ## 理论与原理 ## 理论基础:Google Dapper Paper 鹰眼 != Dapper It is just an implementation 绝大多数的追踪系统, 并不使用这种编号方式   ## 挑战:数据孤岛、资源开销 Low volume 












