腾讯基于 Kubernetes 的企业级容器云实践-罗韩梅管理机挂掉:对应用无影响 • 计算节点挂掉:跨机迁移 • 健康探针 ① 存活探针 ② 就绪探针 • 负载均衡 • 重启机制 ① 区分异常原因 ② 本地重启/跨机重启 • 黑名单机制 • 集群核心数据的备份和恢复 ① Etcd ② 核心数据库 • 云盘机制保护应用数据 • 举例:1.4升级1.9版本 • Pod Hash发生变化 • Container名称发生变化,点分隔改为了下划线分隔 • 容器标签发生变化 当该服务要升级新的版本时,如果对所有实例停止,则会造 成服务中断;如果采用滚动升级,无法保证升级过程是否有 异常,以及无法充分验证新版本的可用性(即使经过了测试 阶段的测试)。 • 通常采用灰度升级的方式:即选择某一个或N个实例先升级到 新版本,在充分稳定验证后,再考虑升级其他实例,而该灰 度的过程可以分为任意批次。有时为了验证多个版本,一个 应用内也可以同时又多个版本并行存在。充分保证现网的服 务质量以及版本的可控性。0 码力 | 28 页 | 3.92 MB | 1 年前3
Kubernetes开源书 - 周立playbook部署kubespray ~]# ansible-playbook -i inventory/mycluster/hosts.ini cluster.yml ⼤概20分钟左右,Kubernetes即可安装完毕。 验证 验证1:查看Node状态 ]# kubectl get nodes NAME STATUS ROLES AGE VERSION node1 Ready 2m v1.11.2 node5 Ready node 2m v1.11.2 每个node都是ready的,说明OK。 验证2:部署⼀个NGINX # 启动⼀个单节点nginx ]# kubectl run nginx --image=nginx:1.7.9 --port=80 # 为“nginx”服务暴露端⼝ ]# Building High-Availability Clusters 。 etcd etcd ⽤作Kubernetes的后端存储。集群的所有数据都存储在此。请为你Kubernetes集群的etcd数据提供备份计划。 kube-controller-manager kube-controller-manager 运⾏Controller,它们是处理集群中常规任务的后台线程。逻辑上来讲,每个Controller都是⼀0 码力 | 135 页 | 21.02 MB | 1 年前3
k8s操作手册 2.3configs."cof-lee.com:5443".tls] insecure_skip_verify = true #跳过安全认证 #如果下载镜像需要身份验证则配置下面3行,不需要身份验证则不用配置 [plugins."io.containerd.grpc.v1.cri".registry.configs."cof-lee.com:5443".auth] daemonset.yml #应用 # kubectl get daemonset #查看 ★Job控制器 job控制器用于运行一次性pod(如执行sql脚本或一次性备份任务等)容器中的 进程在正常运行结束后,置为completed状态,且不会再重启,如果进程运行失 败,则根据配置决定是否要重启 # vi xx-job.yml #内容如下 apiVersion: nginx-pod-cm-tz printenv #查看pod里的环境变量 ③创建Secret secret资源是区分命名空间的 ★命令行方式创建secret 创建账号密码验证secret # kubectl create secret generic database-auth --from-literal=username=root --from- literal=password=passwd1230 码力 | 126 页 | 4.33 MB | 1 年前3
202106 KubeOperator:开源的轻量级 Kubernetes 发行版
是否可视化⻚页⾯面,部署⻔门槛? a. 集群如何⽆无缝升级? b. 集群如何快速扩容? c. 监控、告警、⽇日志是否完善? d. 如何进⾏行行快速安全加固? e. 集群如何进⾏行行备份和恢复? 1 2 企业在云原⽣生时代的挑战 3 KubeOperator 开源容器器平台的技术优势 KubeOperator 开源容器器平台企业版 KubeOperator 的使命 KubeOperator 是开源的轻量量级 Kubernetes 发⾏行行版,专注于帮助企业规划、部署和运营 ⽣生产级别的 Kubernetes 集群。 计算 ⽹网络 存储 ⽤用途 ⼀一键部署 可视化安装 管理理 备份 伸缩 监控 ⽇日志 Day 0 Day 1 Day 2 规 划 部 署 运 营 升级 在线 / 离线 KubeOperator 的开发团队和运作模式 • 由 Jumpserver OpenStack / FusionCompute 等 Ansible / Terraform CentOS / RHEL / EulerOS 集群规划 集群部署 集群运维 集群升级 集群伸缩 集群备份 应⽤用商店 开源的轻量量级 Kubernetes 发⾏行行版 KubeOperator 的技术优势 按需创建 ⼀一键创建和部署 K8S 集群 按需伸缩 快速伸缩 K8S 集群, 提升资源使⽤用效率0 码力 | 20 页 | 1.62 MB | 1 年前3
Operator Pattern 用 Go 扩展 Kubernetes 的最佳实践performance profile Observerbility 日志、系统指标等采集、分析;监控配置与报警;性能 指标收集与分析等等。 Backup & Restore 备份策略、备份方式、恢复方式、备份管理等等。 Disaster Recovery & High Availability Failover/Switchover、多可用区、数据恢复等等。 Security &0 码力 | 21 页 | 3.06 MB | 9 月前3
DaoCloud Enterprise 5.0
产品介绍异构 中间件服务 专为有状态应用设计的云原生本地存储能力,满足中间件高 I/O 的存储需求,提升运 维管理效率。精选各类数据库、分布式消息和日志检索等中间件,提供多租户、部 署、观测、备份、运维操作等全生命周期的中 间件管理能力,实现数据服务的自助化 申请、弹性扩展、高并发处理和稳定高可用。 涉及的模块:全局管理、容器管理、云原生网络、云原生存储、精选中间件 版权 © 2023 Kubernetes 集群,快速搭建企业级容器云平台,适配物理机和虚拟机 底层环境。 ➢ 一键式集群升级,一键升级 Kubernetes 版本,统一管理系统组件升级。 ➢ 集群高可用,内置集群容灾、备份能力,保障业务系统在主机故障、机房中断、自然 灾害等情况下可恢复,提高生产环境的稳定性,降低业务中断风险。 ➢ 集群的全生命周期管理,实现自建云原生集群的全生命周期管理。 ➢ 开放式 API 使用。 ➢ 资源限制策略,支持以命名空间或集群粒度设定资源限制策略,约束对应命名空间内 应用对资源的使用。 ➢ 灾备策略,支持以命名空间或集群粒度设定灾备策略,实现以命名空间为维度进行容 灾备份,保障集群的安全性。 版权 © 2023 DaoCloud 第 10 页 ➢ 安全策略,支持以命名空间或集群粒度设定安全策略,为 Pod 定义不同的隔离级 别。 全局管理0 码力 | 18 页 | 1.32 MB | 1 年前3
第29 期| 2023 年9 月- 技术雷达chai-a11y-axe 的测试框架 插件 API 已提供了基础的可访问性断言,具有可访问性意识的组件测试设计依然能够帮助测试进一步检验屏幕 阅读器和其他辅助技术所需的全量语义元素。 首先,在测试验证元素时,通过 ARIA 角色或者元素的其它语义化属性查找元素,而不采用元素的 test id 或 class 属性。像 Testing Library 的一些测试库甚至已经在文档中推荐了这一实践。其次,不要仅仅测试点击交互,还 14 7. OIDC for GitHub Actions 试验 推荐实现 CI/CD 的零信任安全的技术之一是通过使用 OpenID Connect(OIDC)等联合身份机制对流水线进行 身份验证,以访问云服务。这一重要的技术仍未被充分利用在 GitHub Actions 中,因此推荐 OIDC for GitHub Actions。通过这种方式,可以避免存储长期的访问令牌来访问云资源,同时确保流水线无法直接访问机密信息。 14. 对告警规则的单元测试 试验 可观测性和监控对于软件团队至关重要。鉴于特定事件的不可预测性,创建具有复杂规则的准确告警机制至关 重要。然而,只有当事件真实出现时,这些规则才能得到真正的验证。对告警规则的单元测试让团队通过预先、 主动地测试和完善规则,来更好地定义规则,从而增加对规则的信心。这有助于减少误报,并确保报告真正的 事件。Prometheus 等工具支持对规则进行单元测试。0 码力 | 43 页 | 2.76 MB | 1 年前3
ALAUDA KUBERNETES 白皮书身,从根本上解决运维难的问题。 ü 集群管理:管理集群下所有主机及命名空间资源 ü 容器及业务流程管理:在 Kubernetes 上构建工作负载的基础架构,具有零宕机滚 动式更新、定点部署,且内置备份、灾难恢复等功能 ü 存储管理:支持存储卷的全生命周期管理 ü 网络管理:支持多种网络模式 Alauda Kubernetes 白皮书 灵雀云 4 ü 监控:可对接客户已有监控平台,也可使用标准0 码力 | 6 页 | 2.35 MB | 1 年前3
2.2.4 基于Kubernetes的私有云实战服务发现方案 •K8S自带的服务发现不可用 •基于Pod事件的服务发现 •现状妥协导致服务发现链路变长 集群失败了 •没有办法操作K8S? •基于假事件的重新调度 •灾难场景可迁移至备份集群 部署平台 •研发平台支持混合部署 •研发直接容器扩容完成迁移 •研发精确控制发版速度 •支持容器回滚到物理机 容器平台 •平台化的多集群管理 •清晰简单的运维操作 •灾难场景一健迁移0 码力 | 47 页 | 10.67 MB | 1 年前3
sealos 以 kubernetes 为内核的云操作系统库 • 写代码像写博客一样简单 • AI 自动编码,毫秒级上线,0 运 维 数据库管理 mysql/pgsql/mongo/ redis 等多种数据库 数据库多主架构高 可用 数据库备份恢复, 故障自愈 数据库管理工具, 监控告警 Userlnterface API/CLI/GUI Cilium Gvisor/Containerd OpenEBS LVM local pv Bare0 码力 | 29 页 | 7.64 MB | 9 月前3
共 17 条
- 1
- 2













