搜索

pdf文档 36-云原生监控体系建设-秦晓辉

3.27 MB 32 页 0 下载 64 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pdf
3
摘要
文档详细介绍了云原生环境下监控体系的建设,重点分析了Kubernetes架构下的监控需求变化。随着云原生技术的发展,监控指标的生命周期变短,数量大幅增长,维度更加丰富。文档指出,Kubernetes体系庞大,监控难度增加,缺乏体系化文档指导。建议采用云厂商提供的托管服务,重点关注工作负载节点的监控,并介绍了常用的宿主监控采集器。
AI总结
# 《36-云原生监控体系建设-秦晓辉》总结 ## 作者介绍 秦晓辉,快猫星云联合创始人,拥有10年运维研发经验,是Open-Falcon、Nightingale、Categraf等开源项目的研发核心成员。目前专注于为客户提供稳定性保障相关的产品。 --- ## 云原生监控体系建设背景 ### 监控需求的变化 1. **指标生命周期变短** - 云原生环境下,基础设施动态化,Pod销毁重建频繁,传统资产视角的管理方式不再适用。 - 采用注册中心自动发现或sidecar模式实现监控对象的自动绑定。 2. **指标数量大幅增长** - 微服务流行导致服务数量激增,指标数量可达之前的十倍甚至更多。 - 研发团队更重视可观测能力,采集器种类繁多,采集范围广泛。 3. **指标维度更为丰富** - 传统监控关注机器、交换机、中间件等,缺乏维度设计。 - 云原生监控更关注应用侧,每个指标需要多个维度标签支持。 4. **平台复杂度变高** - Kubernetes体系庞大,涉及underlay、overlay网络,容器内外namespace,学习和监控难度增加。 - 缺乏体系化文档指导,关键指标和最佳实践需深入研究。 --- ## Kubernetes架构下的监控组件 ### 监控范围 1. **服务端组件(控制面)** - API Server、Scheduler、Controller-Manager、ETCD等核心组件的监控。 2. **工作负载节点** - 监控重点:Pod容器、节点本身(Node)、kubelet和kube-proxy。 - Kubernetes托管服务建议采用云厂商提供的托管方式,避免自行搭建。 3. **业务程序** - 部署在容器中的业务程序监控是最重要的部分。 ### 监控层次 1. **Kubernetes所在宿主的监控** - 常规指标:CPU、Mem、Disk、DiskIO、Net、Netstat、Processes、System、Conntrack、Vmstat等。 - 工具:Telegraf、Grafana-agent、Datadog-agent、node-exporter、Categraf等。 2. **Kubernetes Node组件监控** - 监控Node层面的健康状态和资源使用情况。 3. **Kubernetes控制面组件监控** - 监控API Server、Scheduler、Controller-Manager、ETCD等组件。 4. **Kubernetes资源对象的监控** - 监控Pod、Service、Deployment、StatefulSet等资源对象的状态和性能。 5. **Pod内的业务应用的监控** - 部署在容器中的业务程序监控,关注应用性能和健康状态。 6. **业务应用依赖的中间件的监控** - 监控数据库、缓存、消息队列等中间件的性能和可用性。 --- ## 总结 云原生环境下的监控体系需要应对指标数量激增、维度复杂、平台复杂度高等挑战。Kubernetes架构的监控需覆盖服务端、工作负载节点和业务程序,采用自动化发现和采集工具,并结合丰富的维度标签实现精细化监控。建议企业优先使用云厂商提供的Kubernetes托管服务,以降低运维复杂度。
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
下载文档到本地,方便使用
- 可预览页数已用完,剩余 20 页请下载阅读 -
文档评分
请文明评论,理性发言.