OpenShift Container Platform 4.10 监控are the property of their respective owners. 摘要 摘要 本文提供有关在 OpenShift Container Platform 中配置和使用 Prometheus 监控堆栈的说明。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ALERTMANAGER 实 实例 例 3.1. 在时间序列和警报中附加额外标签 3.2. 为监控组件设置日志级别 3.3. 为 PROMETHEUS 启用查询日志文件 3.4. 为 THANOS QUERIER 启用查询日志记录 第 第 4 章 章 为 为 PROMETHEUS ADAPTER 设 设置 置审计 审计日志 日志级别 级别 4.1. 禁用默认的 GRAFANA 部署 4.2. 禁用本地 访问第三方监控 UI 12.2. 访问第三方监控 WEB 服务 API 12.3. 使用 PROMETHEUS 的联邦端点查询指标 12.4. 其他资源 第 第 13 章 章 监 监控 控问题 问题的故障排除 的故障排除 13.1. 检查为什么用户定义的指标不可用 13.2. 确定为什么 PROMETHEUS 消耗大量磁盘空间 第 第 14 章 章 CLUSTER MONITORING OPERATOR0 码力 | 135 页 | 1.58 MB | 1 年前3
以外部模式部署OpenShift Container Storage如需了解更多详细信息,请参阅在外部模式中对 CephFS PVC 创建进行故障排除。 Red Hat Ceph Storage 必须安装并配置 Ceph 控制面板,并且 Ceph Manager Prometheus 导出 器必须使用端口 9283。如需更多信息,请参阅 Ceph 控制面板安装和访问。 建议对外部 Red Hat Ceph Storage 必须启用 PG Autoscaler 选项。如需更多信息,请参阅 IP 地址。如果没有提供,则会自动填充该值。 --monitoring-endpoint-port 是可选的。它是与 --monitoring-endpoint 指定的 ceph- mgr Prometheus exporter 关联的端口。如果没有提供,则会自动填充该值。OpenShift Container Storage 4.6 仅支持端口 9283。 -- run-as-user 是一个可选参数,用于为 3/3 Running 0 8d pod/prometheus-adapter- 5df5865596-k8dzn 1/1 Running 0 7d23h pod/prometheus-adapter- 5df5865596-n2gj9 1/1 Running0 码力 | 29 页 | 738.90 KB | 1 年前3
OpenShift Container Platform 4.8 Service MeshMAISTRA-2648 ServiceMeshExtensions 目前与 IBM Z Systems 上部署的网格不兼容。 MAISTRA-1959 迁移到 2.0 Prometheus 提取(spec.addons.prometheus.scrape 设置为 true)在启用 mTLS 时无法正常工作。另外,当禁用 mTLS 时,Kiali 会显示无关的图形数据。 可通过将端口 15020 从代理配置中排除来解决这个问题,例如: CreateContainerConfigError。 从 kube 开始的 OSSM-722 命名空间从 Kiali 中隐藏。 OSSM-569 Prometheus istio-proxy 容器没有 CPU 内存限值。Prometheus istio-proxy sidecar 现在使用 spec.proxy.runtime.container 中定义的资源限值。 OSSM-449 VirtualService 到影响: Galley Grafana Istiod OpenShift Container Platform 4.8 Service Mesh 24 Jaeger Kiali Prometheus Sidecar injector MAISTRA-2378 当集群被配置为使用带有 ovs-multitenant 的 OpenShiftSDN,且网格包含大量 命名空间(200+),OpenShift0 码力 | 344 页 | 3.04 MB | 1 年前3
OpenShift Container Platform 4.1 发行注记原因 Hawkular 被 cluster monitoring(集群监控)替代。 Cassandra 被 cluster monitoring(集群监控)替代。 Heapster 由 Prometheus adapter 替代。 Atomic Host 由 Red Hat Enterprise Linux CoreOS 替代。 系统容器 由 Red Hat Enterprise Linux 基本安装和 OperatorHub 提供的功能 提供的功能 功能 功能 新的安装程序( 新的安装程序(installer) ) OperatorHub 控制台和身份验证 * [x] - Prometheus cluster monitoring * [x] - OTA(Over-the-air)升级 * [x] - 机器管理 * [x] - 可选的服务代理 - * [x] 可选的 OpenShift HPA)。作为这种技术预览的一部分,现在可以部署一个 Prometheus Adapter 组 件来为定制的 metrics API 提供应用程序的指标数据(metrics)。 限制: 该适配器只连接到一个 Prometheus 实例(或一组使用 Kubernetes 服务的,实现负载均衡功能的 一组实例)。 手动部署适配器并把它配置为使用 Prometheus。 Prometheus Adapter 配置的语法规则可能会在以后有所变化。0 码力 | 22 页 | 287.47 KB | 1 年前3
OpenShift Container Platform 4.8
Web 控制台KIALI-3096 Runtime metrics 在 Service Mesh 中失败。在 Service Mesh 和 Prometheus 之间有 一个 OAuth 过滤器,需要向 Prometheus 传递一个 bearer 令牌才会授予访问权限。Kiali 已被更 新为在与 Prometheus 服务器通讯时使用这个令牌,但应用程序的 metrics 当前会有 403 错误。 KIALI-3070 此程序错误只会影响自定义 Istio 数据和配置,这些数据和配置可以通过 Prometheus 和集群 API 获得。 Prometheus - 一个专用的 Prometheus 实例作为 Red Hat OpenShift Service Mesh 安装的一部 分被包括。当启用 Istio 遥测时,指标数据保存在 Prometheus 中。Kiali 使用这个 Prometheus 数 据来决定网状拓扑结构、显示指标数据、计 Container Platform 4.2 Service Mesh 12 Prometheus 直接沟通,并假设 Istio Telemetery 使用的数据 schema。Istio 依赖于 Prometheus,Kiali 也依赖于 Prometheus。许多 Kiali 的功能在没有 Prometheus 的情况下将无法 工作。 Cluster API - Kiali 使用 OpenShift0 码力 | 87 页 | 1.58 MB | 1 年前3
OpenShift Container Platform 4.14 Operator的令牌身份验证 5.11. 使用 SCORECARD 工具验证 OPERATOR 5.12. 验证 OPERATOR 捆绑包 5.13. 高可用性或单节点集群检测和支持 5.14. 使用 PROMETHEUS 配置内置监控 5.15. 配置领导选举机制 5.16. 为多平台支持配置 OPERATOR 项目 5.17. 基于 GO 的 OPERATOR 的对象修剪工具 4 4 4 5 6 在以下示例中,为 Prometheus Operator 和 etcd CRD 指定依赖项: dependencies.yaml 文件示例 文件示例 其他 其他资源 源 Operator Lifecycle Manager 依赖项解析 dependencies: - type: olm.package value: packageName: prometheus 6:5891b5b522d5df086d0ff0b110fbd9d21bb4fc7163af34d08286a2e846f 6be03 - name: prometheus-operator image: quay.io/prometheus- operator/index@sha256:e258d248fda94c63753607f7c4494ee0fcbe92f1a76bfdac795c9d841010 码力 | 423 页 | 4.26 MB | 1 年前3
OpenShift Container Platform 3.11 扩展和性能指南速率发出的请求数量取决于突发值,这对具有极限的应用程序来说非常 有用,并可执行不监管的请求数量。当 API 服务器处理大量并发请求时,对请求的响应时间,特别是大型 和/或高密度的集群。建议您监控 Prometheus 中的 apiserver_request_count 速率指标,并相应地调整 maxRequestsInFlight 和 QPS。 更改默认值时,需要有一个很好的平衡,因为 API 服务器的 重要 重要 测试显示,使用 RHEL NFS 服务器作为容器镜像 registry 的存储后端可能会出现问题。这 包括 OpenShift Container Registry 和 Quay、Prometheus for metrics 存储,以及 ElasticSearch for logging 存储。因此,不建议使用 RHEL NFS 服务器来备份核心服务使用 的 PV。 市场上的其他 NFS 接口(grafana)中查看系统资源、 容器和组件指标。 本节提供有关扩展集群监控操作器的信息。 如果要将 Prometheus 与持久性存储搭配使用,您必须将 Ansible 清单文件中的 openshift_cluster_monitoring_operator_prometheus_storage_enabled 变量设置为 true。 10.2. 针对 OPENSHIFT CONTAINER0 码力 | 58 页 | 732.06 KB | 1 年前3
OpenShift Container Platform 4.14 发行注记Operator 现在为镜像 registry 处理分布证书颁发机构。这个更改不会影响最终用户。 1.3.16.2. Prometheus 中可用的其他指 中可用的其他指标 标 在这个版本中,您可以查询额外的指标来更密切地监控机器和机器配置池的状态。 有关如何使用 Prometheus 的更多信息,请参阅查看可用指标列表。 1.3.16.3. 支持离 支持离线 线 Tang 置 置备 备 在这个版本中,您可以使用 kube-state-metrics 更新到 2.9.2 node-exporter 更新到 1.6.1 prom-label-proxy 更新到 0.7.0 Prometheus 更新到 2.46.0 prometheus-operator 更新到 0.67.1 1.3.19.2. 对 对警 警报规则 报规则的更改 的更改 注意 注意 红帽不保证记录规则或警报规则的向后兼容性。 New 服务。 添加了 NodeMemoryMajorPagesFaults 警报,以监控节点上的主要页面错误。 添加了 PrometheusSDRefreshFailure 警报,以监控失败的 Prometheus 服务发现。 已更改 已更改 修改了 KubeAggregatedAPIDown 警报和 KubeAggregatedAPIErrors 警报,以仅评估 apiserver 作业的指标。0 码力 | 73 页 | 893.33 KB | 1 年前3
OpenShift Container Platform 4.14 分布式追踪1.4.5.1. 新功能及功能增 新功能及功能增强 强 此发行版本为 OpenTelemetry 的红帽构建引入了以下改进: 支持 OTLP 指标 ingestion。指标可以通过 Prometheus 导出器转发并存储在 user-workload- monitoring 中。 支持 Operator 成熟度 级别 IV、Deep Insights,它启用了对 OpenTelemetry OpenTelemetry Collector 是一个与厂商无关的方式来接收、处 理和导出遥测数据。OpenTelemetry Collector 支持开源可观察数据格式,如 Jaeger 和 Prometheus,发送到一个或多个开源或商业后端。Collector 是默认位置检测库来导出其遥测 数据。 2.1.4. 其他资源 Red Hat build of OpenTelemetry 第 第 分布式追踪平台(TEMPO) 87 jaegerQuery.monitorTab.pro metheusEndpoint 包含 span rate、error 和 duration (RED) 指标的 Prometheus 实例的 端点。例如:https://thanos- querier.openshift- monitoring.svc.cluster.local: 9091。 类型:字符串 参数 参数0 码力 | 100 页 | 928.24 KB | 1 年前3
OpenShift Container Platform 4.8 容器镜像仓库(Registry)Managed。 注意 注意 第 第 2 章 章 OPENSHIFT CONTAINER PLATFORM中的 中的IMAGE REGISTRY OPERATOR 7 注意 注意 Prometheus 控制台提供了一个 ImageRegistryRemoved 警报,例如: "镜像注册表已被删除。镜 镜像流 像流标签 标签、 、 BuildConfig 和 和 DeploymentConfig, 在这些平台类型上完成安装。 安装后,您必须编辑 Image Registry Operator 配置,将 managementState 从 Removed 切换到 Managed。 注意 注意 Prometheus 控制台提供了一个 ImageRegistryRemoved 警报,例如: "镜像注册表已被删除。镜 镜像流 像流标签 标签、 、 BuildConfig 和 和 DeploymentConfig, '{"spec": {"rolloutStrategy":"Recreate","replicas":1}}' 第 第 3 章 章 设 设置和配置 置和配置 REGISTRY 23 注意 注意 Prometheus 控制台提供了一个 ImageRegistryRemoved 警报,例如: "镜像注册表已被删除。镜 镜像流 像流标签 标签、 、 BuildConfig 和 和 DeploymentConfig,0 码力 | 39 页 | 415.94 KB | 1 年前3
共 48 条
- 1
- 2
- 3
- 4
- 5













