深入 Kubernetes 的无人区-蚂蚁金服双十一的调度系统
2.18 MB
19 页
0 评论
语言 | 格式 | 评分 |
---|---|---|
中文(简体) | .pdf | 3 |
摘要 | ||
文档详细介绍了蚂蚁金服在Kubernetes生态系统中的发展历程和实践经验。从2018年下半年的研发启动,到2019年初在生产环境中进行灰度验证,再到同年4月完成云化环境适配以及7月前 toàn站 Kubernetes 认领,蚂蚁金服实现了超过90%的资源通过Kubernetes分配,核心链路在双十 Getter期间提供了完全支持。文档还讨论了双十一期间的Kubernetes实践,包括资源分时调度、大规模腾挪问题及调度性能优化,以及 Operator 开发最佳实践等内容。 | ||
AI总结 | ||
《深入 Kubernetes 的无人区——蚂蚁金服双十一的调度系统》总结如下:
### 一、蚂蚁金服的 Kubernetes 现状
1. **发展历程**:
- 2018年下半年开始研发 Kubernetes 及其配套系统。
- 2019年初在生产环境中灰度验证。
- 2019年4月完成云化环境适配。
- 2019年7月至双十一前完成全站 Kubernetes 落地。
2. **规模化落实**:
- 超过90%的资源通过 Kubernetes 分配。
- 核心链路100%落地支撑大促。
- 单集群规模超一万,数十万应用 Pods。
3. **统一资源调度架构**:
- 支持分时复用、弹性容量、资源画像等功能。
-集成了多种组件,如 CSI、CNI、GPU 支持等。
---
### 二、双十一 Kubernetes 实践
1. **资源分时调度**:
- 通过 Kubernetes 实现了资源的分时复用。
- 解决了快速腾挪的实例预热、耗时不可控和稳定性问题。
2. **调度性能优化**:
- 优化了调度算法和资源分配策略。
- 提升了大规模场景下的调度稳定性。
3. **Operator 开发最佳实践**:
- CRD 定义需考虑未来扩展性。
- 优先采用 Namespaced scope 控制资源影响范围。
- 避免使用潜在破坏性的 MutatingWebhook。
- 通过 Informers 和限流机制提升稳定性。
-DaemonSet 使用需谨慎,建议在专家指导下操作。
4. **高可用与容灾**:
- 构建了高可用架构。
- 集成了多种存储和网络解决方案。
---
### 三、展望未来挑战
蚂蚁金服计划在以下方面继续优化和扩展 Kubernetes 的应用:
1. **业务扩展**:支持更多复杂场景。
2. **技术创新**:深入优化 Kubernetes 核心功能。
3. **生态完善**:进一步丰富 Kubernetes 生态系统。
---
该总结涵盖了蚂蚁金服在 Kubernetes 实践中的关键成果、技术挑战及未来方向,重点突出了其在双十一大促中的核心应用和创新实践。 |
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
下载文档到本地,方便使用
- 可预览页数已用完,剩余
7 页请下载阅读 -
文档评分