pdf文档 深入 Kubernetes 的无人区-蚂蚁金服双十一的调度系统

2.18 MB 19 页 0 评论
语言 格式 评分
中文(简体)
.pdf
3
摘要
文档详细介绍了蚂蚁金服在Kubernetes生态系统中的发展历程和实践经验。从2018年下半年的研发启动,到2019年初在生产环境中进行灰度验证,再到同年4月完成云化环境适配以及7月前 toàn站 Kubernetes 认领,蚂蚁金服实现了超过90%的资源通过Kubernetes分配,核心链路在双十 Getter期间提供了完全支持。文档还讨论了双十一期间的Kubernetes实践,包括资源分时调度、大规模腾挪问题及调度性能优化,以及 Operator 开发最佳实践等内容。
AI总结
《深入 Kubernetes 的无人区——蚂蚁金服双十一的调度系统》总结如下: ### 一、蚂蚁金服的 Kubernetes 现状 1. **发展历程**: - 2018年下半年开始研发 Kubernetes 及其配套系统。 - 2019年初在生产环境中灰度验证。 - 2019年4月完成云化环境适配。 - 2019年7月至双十一前完成全站 Kubernetes 落地。 2. **规模化落实**: - 超过90%的资源通过 Kubernetes 分配。 - 核心链路100%落地支撑大促。 - 单集群规模超一万,数十万应用 Pods。 3. **统一资源调度架构**: - 支持分时复用、弹性容量、资源画像等功能。 -集成了多种组件,如 CSI、CNI、GPU 支持等。 --- ### 二、双十一 Kubernetes 实践 1. **资源分时调度**: - 通过 Kubernetes 实现了资源的分时复用。 - 解决了快速腾挪的实例预热、耗时不可控和稳定性问题。 2. **调度性能优化**: - 优化了调度算法和资源分配策略。 - 提升了大规模场景下的调度稳定性。 3. **Operator 开发最佳实践**: - CRD 定义需考虑未来扩展性。 - 优先采用 Namespaced scope 控制资源影响范围。 - 避免使用潜在破坏性的 MutatingWebhook。 - 通过 Informers 和限流机制提升稳定性。 -DaemonSet 使用需谨慎,建议在专家指导下操作。 4. **高可用与容灾**: - 构建了高可用架构。 - 集成了多种存储和网络解决方案。 --- ### 三、展望未来挑战 蚂蚁金服计划在以下方面继续优化和扩展 Kubernetes 的应用: 1. **业务扩展**:支持更多复杂场景。 2. **技术创新**:深入优化 Kubernetes 核心功能。 3. **生态完善**:进一步丰富 Kubernetes 生态系统。 --- 该总结涵盖了蚂蚁金服在 Kubernetes 实践中的关键成果、技术挑战及未来方向,重点突出了其在双十一大促中的核心应用和创新实践。
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
下载文档到本地,方便使用
- 可预览页数已用完,剩余 7 页请下载阅读 -
文档评分
请文明评论,理性发言.