Pod 容忍节点异常时间调整Pod 容忍节点异常时间调整 容忍节点异常时间调整 1. 原理说明 原理说明 Kubernetes 集群节点处于异常状态之后需要有⼀个等待时间,才会对节点上的 Pod 进⾏驱逐。那么针对部分关键业务,是否可以调整这个时间,便于在节点发⽣异常时及时将 Pod 驱逐 并在别的健康节点上重建? 要解决这个问题,我们⾸先要了解 Kubernetes 在节点异常时驱逐 Pod 的机制。 在 Kubernetes 这两个 feature gate,节点及其上 Pod 的⽣命周期管理将通过节点的 Condition 和 Taint 来进⾏,Kubernetes 会不断地检查所有节点状态,设置对应的 Condition,根据 Condition 为节点设置对应的 Taint,再根据 Taint 来驱逐节点上的 Pod。 同时在创建 Pod 时会默认为 Pod 添加相应的 tolerationSeconds tolerationSeconds 参数,指定当节点出现异常(如 NotReady)时 Pod 还将在这个节点上运⾏多⻓的时间。 那么,节点发⽣异常到 Pod 被驱逐的时间,就取决于两个参数:1. 节点实际异常到被判断为不健康的时间;2. Pod 对节点不健康的容忍时间。 Kubernetes 集群中默认节点实际异常到被判断为不健康的时间为 40s,Pod 对节点 NotReady 的容忍时间为 5min,也就是说,节点实际异常0 码力 | 4 页 | 104.64 KB | 1 年前3
Docker 从入门到实践 0.9.0(2017-12-31)复杂的设置工作。系统会自动 选取合适的工作节点来执行具体的容器集群调度处理工作。其核心概念是 Container Pod 。 一个 Pod 由一组工作于同一物理工作节点的容器构成。这些组容器拥有相同的网络命名空 间、IP以及存储配额,也可以根据实际情况对每一个 Pod 进行端口映射。此 外, Kubernetes 工作节点会由主系统进行管理,节点包含了能够运行 Docker 容器所用到的 0 "/pause" 2 days ago Up 2 days k8s_POD.e4cc795_k8s-mast er-127.0.0.1_default_9941e5170b4365bd4aa91f122ba0c061_e8085b1f c060c52acc36 方式供客户端和其它组件调用; scheduler 负责对资源进行调度,分配某个 pod 到某个节点上; controller-manager 负责管理控制器,包括 endpoint-controller(刷新服务和 pod 的关 联信息)和 replication-controller(维护某个 pod 的复制为配置的数值)。 工作节点服务 kubelet 是工作节点执行操作的0 码力 | 370 页 | 6.73 MB | 1 年前3
Docker 从入门到实践 0.4云端容器集群的管理,而无需用户进行复杂的设置工作。系统会自动选取合适的工作节点来执行具体的容 器集群调度处理工作。其核心概念是Container Pod(容器仓)。一个Pod是有一组工作于同一物理工作节 点的容器构成的。这些组容器拥有相同的网络命名空间/IP以及存储配额,可以根据实际情况对每一个Pod 进行端口映射。此外,Kubernetes工作节点会由主系统进行管理,节点包含了能够运行Docker容器所用到 的服务。 节点:一个节点是一个运行Kubernetes中的主机。 容器组:一个Pod对应于由若干容器组成的一个容器组,同个组内的容器共享一个存储卷(volume)。 容器组生命周期:包含所有容器状态集合,包括容器组状态类型,容器组生命周期,事件,重启策 略,以及replication controllers。 Replication Controllers:主要负责指定数量的pod在同一时间一起运行。 服务:一个Kuber0 码力 | 179 页 | 2.27 MB | 1 年前3
共 3 条
- 1













