pdf文档 36-云原生监控体系建设-秦晓辉

3.27 MB 32 页 0 评论
语言 格式 评分
中文(简体)
.pdf
3
摘要
文档阐述了云原生环境下监控体系的建设,重点讨论了Kubernetes架构及其组件监控的需求变化。云原生环境下,基础设施动态化导致Pod频繁销毁重建,传统监控体系已不适用。文档详细列出了从Kubernetes架构角度需要监控的组件,包括宿主、Node组件、控制面组件、资源对象、Pod和容器内的业务应用,以及依赖的中间件。指标生命周期变短、数量大幅增长、维度更为丰富带来了更高的监控需求。宿主监控主要关注基础资源如CPU、Mem、Disk等,常用采集器包括Telegraf、Grafana-agent等。本文还建议采用托管Kubernetes服务以降低复杂度。
AI总结
### 云原生监控体系建设总结 #### 一、云原生监控需求的变化 1. **动态化与频繁变化**:相比物理机和虚拟机时代,云原生环境下的基础设施动态化,Pod频繁销毁重建,传统资产视角管理不再适用,需采用注册中心自动发现或Sidecar模式。 2. **指标数量激增**:微服务普及后,监控指标数量大幅增长,一个中间件实例可能采集数千个指标。 3. **指标维度丰富**:新一代监控系统更加关注应用侧监控,每个指标可能带多个维度标签。 #### 二、Kubernetes架构下的监控组件 1. **服务端组件(控制面)**:包括API Server、Scheduler、Controller-Manager、ETCD等,需监控其性能和可用性。 2. **工作负载节点**:关注Pod、容器及节点本身的监控,主要包括kubelet和kube-proxy。 3. **业务程序**:部署在容器中的业务程序监控最为重要。 4. **资源对象**:包括 Deployment、ReplicaSet、Pod、Service 等资源的监控。 5. **中间件依赖**:监控业务应用依赖的中间件,如数据库、消息队列等。 #### 三、监控重点与建议 1. **托管服务推荐**:建议使用云厂商提供的Kubernetes托管服务,减少自建复杂性和维护成本。 2. **宿主机监控**:监控Kubernetes所在宿主机的基础资源(如CPU、内存、磁盘IO等),可通过Telegraf、Grafana-agent、node-exporter等工具实现。 3. **工作负载节点监控**:重点关注Pod、节点和kubelet的性能及健康状态。 4. **业务应用与中间件监控**:通过埋点和Sidecar模式,采集业务应用和中间件的详细指标。 #### 四、个人介绍 秦晓辉,快猫星云联合创始人,12年运维研发经验,曾参与Open-Falcon、Nightingale、Categraf等开源项目研发,专注于为客户提供稳定性保障相关产品。
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
下载文档到本地,方便使用
- 可预览页数已用完,剩余 20 页请下载阅读 -
文档评分
请文明评论,理性发言.