Kubernetes 异常配置检测框架## Kubernetes 异常配置检测框架 顾静, 阿里云 邓隽, 阿里云 ## 我们来自阿里云容器服务 • 顾静,研发工程师 • 邓隽,技术专家 ## 我们参与打造 • 容器服务(ACK/ASK) • 容器镜像服务(ACR) • 服务网格(ASM) 1 Kubernetes 典型异常 2 检测框架演进 3 生产实践 4 总结 ## Kubernetes 使用日常 使用日常 • 应用部署 • 集群扩容 • 组件升级 · ... • 找出集群不正常工作的原因:( ## Kubernetes 典型异常 ## 组件异常 • API Server Load Balancer 异常 • API Server Pod 异常 ## 影响 - 通过 API Server 访问集群概率失败 • 升级集群失败 Load Balancer  ## 链滴 ## consul 集群搭建 作者:boolean-dev 原文链接:https://ld246.com/article/1545917881597 来源网站:链滴 许可协议:署名-相同方式共享4.0国际(CC BY-SA 4.0) ## consul集群搭建 consul agent -data-dir /tmp/node0 -node=node00 码力 | 2 页 | 124.59 KB | 2 年前3
使用 Docker 建立 MySQL 集群# 使用 Docker 建立 Mysql 集群 ## 软件环境介绍 操作系统:Ubuntu server 64bit 14.04.1 Docker 版本 1.6.2 数据库:Mariadb 10.10 (Mariadb 是 MySQL 之父在 MySQL 被 Oracle 收购之后创建的分支,性能上优于 MySQL 开源版本) ## 第一步 安装 Docker 对于 Ubuntu,建议直接联网安装 MYSQL_PASSWORD=medical_waste \ -e MYSQL_DATABASE=medical_waste \ -e TERM=linux \ -d mariadb ## 第三步 配置一主一从集群 ### 3.1 接下来启动另一个容器作为从数据库,因为镜像不支持在容器内进入 mysql 控制台,所以依然需要把端口暴露出来以供局域网访问,但主数据库容易可以链接进来作为一个可访问的主机 --link <主数据库容器名>:master_db -d mariadb ### 3.2 接下来就需要配置两个数据库了,前提工作是镜像中并没有自带 vi,所以在两个容器内都需要: apt-get update apt-get install vim 这样我们才能在容器内修改配置文件。 还有一种方法,就是我们在主数据库容器中操作,之后,使用 docker commit〈主数据库容器名〉mariadb0 码力 | 3 页 | 103.32 KB | 1 年前3
Java 应用系统开发 - ServletContext 和 Web 配置# Java 应用系统开发 ServletContext 和 Web 配置 王晓东 wangxiaodong@ouc.edu.cn 中国海洋大学 November 26, 2018  0 码力 | 33 页 | 668.91 KB | 2 年前3
OpenShift Container Platform 4.7 更新集群jpg) ### OpenShift Container Platform 4.7 ## 更新集群 更新 OpenShift Container Platform 集群 Powered by TCPDF (www.tcpdf.org) 更新 OpenShift Container Platform 集群 Enter your first name here. Enter your surname Container Platform 集群的信息。更新集群的过程较简单,可以在不需要使集群离线的情况下进行。 ## 目录 第1章 了解 OPENSHIFT UPDATE SERVICE ..... 4 1.1. 关于 OPENSHIFT UPDATE 服务 ..... 4 1.2. 非受管 OPERATOR 的支持策略 ..... 4 第2章 更新集群概述 ..... 6 2.1 安装和配置 OPENSHIFT UPDATE SERVICE ..... 6 2.3. 了解升级频道和发行版本 ..... 6 2.4. 使用 WEB 控制台更新集群 ..... 6 2.5. 使用 CLI 更新集群 ..... 6 2.6. 执行 CANARY ROLLOUT 更新 ..... 7 2.7. 更新包含使用 RHEL 的计算(COMPUTE)系统的集群 ...0 码力 | 62 页 | 716.72 KB | 2 年前3
OpenShift Container Platform 4.14 更新集群jpg) ### OpenShift Container Platform 4.14 ## 更新集群 更新 OpenShift Container Platform 集群 Powered by TCPDF (www.tcpdf.org) 更新 OpenShift Container Platform 集群 ## 法律通告 Copyright $ \copyright $ 2024 Red Hat 摘要 本文档提供了有关更新和升级 OpenShift Container Platform 集群的信息。更新集群的过程较简单,可以在不需要使集群离线的情况下进行。 ## 目录 第1章 了解 OPENSHIFT 更新 ..... 3 1.1. OPENSHIFT 更新简介 ..... 3 1.2. 集群更新如何工作 ..... 7 1.3. 了解更新频道和发行版本 ..... 14 1 第2章 准备更新集群 ..... 23 2.1. 准备升级到 OPENSHIFT CONTAINER PLATFORM 4.14 ..... 23 2.2. 准备使用手动维护的凭证更新集群 ..... 27 2.3. PREFLIGHT 验证内核模块管理 (KMM) 模块 ..... 44 第3章 执行集群更新 ..... 48 3.1. 使用 CLI 更新集群 ..... 480 码力 | 149 页 | 1.94 MB | 2 年前3
Zabbix高级应用 -- K8S 集群监控## 演讲主题 ## Zabbix高级应用 --K8s集群监控  ## 当代张思德 高级运维工程师,FiberHome ## ZABBIX 2019 Conference • Cactifans • Zabbix • Microservice0 码力 | 25 页 | 11.98 MB | 2 年前3
KubeCon2020/大型Kubernetes集群的资源编排优化0 码力 | 27 页 | 3.91 MB | 2 年前3
Uber 核心派单系统及其集群管理演化-李宁CaaS (DB) ## 架构调整: 容器化和Mesos ·Puppet退出服务层,只负责底层系统 ·全局config(clusto)退位 ·服务层自主控制infra配置 ·为其他运维变更提供了可能性 Pinocchio配置,控制docker镜像的生成 geobase ▷ udeploy ▷ pinocchio ▷ XML geobase.yaml 1 service_name: geobase Controller Host A Host B Muttley Muttley RPC Service B Service A Service C ## 手动发送1%流量到新集群 2 acceptor: 3 udeploy: acceptor 4 uns: uns://$zone/$zone-prod01/us1/acceptor 5 pools: 6 - zone: dca1 24aee47dc0b585a03893d29a106/p18_1.jpg) ## 故障恢复:自愈力和自动排障 右侧是Uber在线服务依赖关系图。对于大规模复杂系统,人工处理故障速度太慢 动态配置和监控(内部,外部)联动,自动回滚。 自动排查故障, 通过 tracking 系统 开源: Jaeger@github ## 流程优化 ## Ring0 - 单一核心组,拥有高系统权线,包括流量切换0 码力 | 23 页 | 15.26 MB | 2 年前3
在大规模Kubernetes集群上实现高SLO的方法0 码力 | 11 页 | 4.01 MB | 2 年前3
共 1000 条
- 1
- 2
- 3
- 4
- 5
- 6
- 100
相关搜索词
Kubernetes异常检测配置检查集群异常DSLConsul集群节点数据中心IP地址命令行参数DockerMariadbMySQL 集群主从复制数据库同步ServletContextWeb 配置ServletConfigWeb 环境对象会话超时更新频道Cluster Version Operator (CVO)canary rollout机器配置池 (MCP)OpenShift CLI (oc)OpenShift CLIPodDisruptionBudgetKubernetes APIZabbixK8SPodsMetrics ServerKubernetes集群资源编排动态调度器多租户资源抢占负载均衡派单系统集群管理架构调整自动化部署监控优化SLO集群健康状态成功率终止Pod数量













