202106 KubeOperator:开源的轻量级 Kubernetes 发行版
是否可视化⻚页⾯面,部署⻔门槛? a. 集群如何⽆无缝升级? b. 集群如何快速扩容? c. 监控、告警、⽇日志是否完善? d. 如何进⾏行行快速安全加固? e. 集群如何进⾏行行备份和恢复? 1 2 企业在云原⽣生时代的挑战 3 KubeOperator 开源容器器平台的技术优势 KubeOperator 开源容器器平台企业版 KubeOperator 的使命 KubeOperator 是开源的轻量量级 Kubernetes 发⾏行行版,专注于帮助企业规划、部署和运营 ⽣生产级别的 Kubernetes 集群。 计算 ⽹网络 存储 ⽤用途 ⼀一键部署 可视化安装 管理理 备份 伸缩 监控 ⽇日志 Day 0 Day 1 Day 2 规 划 部 署 运 营 升级 在线 / 离线 KubeOperator 的开发团队和运作模式 • 由 Jumpserver OpenStack / FusionCompute 等 Ansible / Terraform CentOS / RHEL / EulerOS 集群规划 集群部署 集群运维 集群升级 集群伸缩 集群备份 应⽤用商店 开源的轻量量级 Kubernetes 发⾏行行版 KubeOperator 的技术优势 按需创建 ⼀一键创建和部署 K8S 集群 按需伸缩 快速伸缩 K8S 集群, 提升资源使⽤用效率0 码力 | 20 页 | 1.62 MB | 1 年前3
DaoCloud Enterprise 5.0
产品介绍现全局负载 均衡,具备故障恢复能力,有效解决多云应用灾备问题,助力企业构建多云、混合云 的数字基础设施。 涉及的模块:全局管理、容器管理、云原生网络、云原生存储、信创异构 中间件服务 专为有状态应用设计的云原生本地存储能力,满足中间件高 I/O 的存储需求,提升运 维管理效率。精选各类数据库、分布式消息和日志检索等中间件,提供多租户、部 署、观测、备份、运维操作等全生命周期的中 间件管理能力,实现数据服务的自助化 集群,快速搭建企业级容器云平台,适配物理机和虚拟机 底层环境。 ➢ 一键式集群升级,一键升级 Kubernetes 版本,统一管理系统组件升级。 ➢ 集群高可用,内置集群容灾、备份能力,保障业务系统在主机故障、机房中断、自然 灾害等情况下可恢复,提高生产环境的稳定性,降低业务中断风险。 ➢ 集群的全生命周期管理,实现自建云原生集群的全生命周期管理。 ➢ 开放式 API 能力,提供原生的 Kubernetes 使用。 ➢ 资源限制策略,支持以命名空间或集群粒度设定资源限制策略,约束对应命名空间内 应用对资源的使用。 ➢ 灾备策略,支持以命名空间或集群粒度设定灾备策略,实现以命名空间为维度进行容 灾备份,保障集群的安全性。 版权 © 2023 DaoCloud 第 10 页 ➢ 安全策略,支持以命名空间或集群粒度设定安全策略,为 Pod 定义不同的隔离级 别。 全局管理0 码力 | 18 页 | 1.32 MB | 1 年前3
Operator Pattern 用 Go 扩展 Kubernetes 的最佳实践日志、系统指标等采集、分析;监控配置与报警;性能 指标收集与分析等等。 Backup & Restore 备份策略、备份方式、恢复方式、备份管理等等。 Disaster Recovery & High Availability Failover/Switchover、多可用区、数据恢复等等。 Security & Compliance 访问控制、审计、安全链接、加密存储等等。 Patching0 码力 | 21 页 | 3.06 MB | 9 月前3
Kubernetes开源书 - 周立Building High-Availability Clusters 。 etcd etcd ⽤作Kubernetes的后端存储。集群的所有数据都存储在此。请为你Kubernetes集群的etcd数据提供备份计划。 kube-controller-manager kube-controller-manager 运⾏Controller,它们是处理集群中常规任务的后台线程。逻辑上来讲,每个Controller都是⼀ ,并且Node上的所有Pod都会被Node Controller驱逐。默认驱逐的超时时间为五分钟 。 在某 些情况下,当Node不可访问时,apiserver⽆法与其上的kubelet进⾏通信。 在与apiserver恢复通信之前,删除Pod的指 令⽆法传达到kubelet。 同时,计划删除的Pod可能会继续在该Node上运⾏。 在Kubernetes 1.5之前,Node Controller将强制从apiserver中 Controller就以正常速率 --node-eviction-rate 驱逐。 当所有区域都不健康时(即 集群中没有健康的Node),Node Controller就会假定Master的连接有问题,并停⽌所有驱逐,直到连接恢复。 从Kubernetes 1.6开始,NodeController还负责驱逐运⾏在“NoExecute taint”的Node上的Pod,当Pod不能忍受这些taint 时。 另外,作为默认禁0 码力 | 135 页 | 21.02 MB | 1 年前3
ALAUDA KUBERNETES 白皮书身,从根本上解决运维难的问题。 ü 集群管理:管理集群下所有主机及命名空间资源 ü 容器及业务流程管理:在 Kubernetes 上构建工作负载的基础架构,具有零宕机滚 动式更新、定点部署,且内置备份、灾难恢复等功能 ü 存储管理:支持存储卷的全生命周期管理 ü 网络管理:支持多种网络模式 Alauda Kubernetes 白皮书 灵雀云 4 ü 监控:可对接客户已有监控平台,也可使用标准0 码力 | 6 页 | 2.35 MB | 1 年前3
sealos 以 kubernetes 为内核的云操作系统• 写代码像写博客一样简单 • AI 自动编码,毫秒级上线,0 运 维 数据库管理 mysql/pgsql/mongo/ redis 等多种数据库 数据库多主架构高 可用 数据库备份恢复, 故障自愈 数据库管理工具, 监控告警 Userlnterface API/CLI/GUI Cilium Gvisor/Containerd OpenEBS LVM local pv Bare0 码力 | 29 页 | 7.64 MB | 9 月前3
腾讯基于 Kubernetes 的企业级容器云实践-罗韩梅管理机挂掉:对应用无影响 • 计算节点挂掉:跨机迁移 • 健康探针 ① 存活探针 ② 就绪探针 • 负载均衡 • 重启机制 ① 区分异常原因 ② 本地重启/跨机重启 • 黑名单机制 • 集群核心数据的备份和恢复 ① Etcd ② 核心数据库 • 云盘机制保护应用数据 • 举例:1.4升级1.9版本 • Pod Hash发生变化 • Container名称发生变化,点分隔改为了下划线分隔 • 容器标签发生变化0 码力 | 28 页 | 3.92 MB | 1 年前3
k8s操作手册 2.3daemonset.yml #应用 # kubectl get daemonset #查看 ★Job控制器 job控制器用于运行一次性pod(如执行sql脚本或一次性备份任务等)容器中的 进程在正常运行结束后,置为completed状态,且不会再重启,如果进程运行失 败,则根据配置决定是否要重启 # vi xx-job.yml #内容如下 apiVersion: connec�on to the server 10.99.1.245:6443 was refused - did you specify the right host or port? 等待几分钟恢复 对于旧的svc,端口范围不在刚刚设置的范围内,也是生效的,新创建的svc端口 范围必须在设置的范围内 ★创建ingress ①部署ingress控制器 ingress控制器(Ingress0 码力 | 126 页 | 4.33 MB | 1 年前3
2.2.4 基于Kubernetes的私有云实战服务发现方案 •K8S自带的服务发现不可用 •基于Pod事件的服务发现 •现状妥协导致服务发现链路变长 集群失败了 •没有办法操作K8S? •基于假事件的重新调度 •灾难场景可迁移至备份集群 部署平台 •研发平台支持混合部署 •研发直接容器扩容完成迁移 •研发精确控制发版速度 •支持容器回滚到物理机 容器平台 •平台化的多集群管理 •清晰简单的运维操作 •灾难场景一健迁移0 码力 | 47 页 | 10.67 MB | 1 年前3
Chaos Mesh让应用与混沌在 Kubernetes 上共舞-杨可奥分钟入门混沌工程 —— 脚本随机杀 Pod 3. … 4. 那网络故障呢?磁盘故障呢?恢复呢?如何控制作用范围? 这是一件复杂的事 TBF/NETEM/... 这是一件困难的事 1. 天然的隔离性和安全性 2. Go 的线程模型与 namespace 机制难以融合 3. 要求运行时注入和恢复 4. 和内核打交道通常都是困难的! Kubernetes 上的混沌工程方案 Chaos TiDB 使用 Raft 一致性算法构建副本,应当拥有容错的能力 ○ 在杀掉一个节点之后,QPS 应当会下降 ○ 一段时间之后,QPS会恢复正常 ● 运行实验 ○ 使得一个节点无法工作(Pod Failure) ● 观察和检验 ○ QPS 下降之后却再也没有恢复到实验前的水平 ○ 我们找到了一个 Bug ! 以 FUXI-Lab 为例 ● Testing components(redis0 码力 | 30 页 | 1.49 MB | 9 月前3
共 18 条
- 1
- 2













