搜索

pdf文档 全球架构师峰会2019北京/大数据/Kubernetes 运行大数据工作负载的探索和实践&mdash

3.84 MB 25 页 1 下载 120 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pdf
3
摘要
文档探讨了Kubernetes在运行大数据工作负载中的应用,特别是Spark的工作机制。文章指出,Kubernetes不仅支持容器编排,还扩展了对数据密集型和有状态应用的支持。然而,Spark在Kubernetes上的应用存在一些缺口,例如资源隔离、动态资源分配和任务抢占等问题。Volcano作为一种Kubernetes-native的批量处理系统,提供了解决方案,包括通过权重共享资源、动态资源分配以及外部 shuffle 服务等优化措施。文档还提到了Volcano的性能优势和未来发展方向。
AI总结
# 全球架构师峰会2019北京/大数据/Kubernetes 运行大数据工作负载的探索和实践 ## 会议主题:Kubernetes 运行大数据工作负载的探索和实践 主讲人:Leibo Wang(华为云BU Principal Engineer) 内容概述: 1. **Why Spark on Kubernetes** - Kubernetes不仅支持容器编排,还扩展支持数据密集型和有状态的应用。 - 优势: - 自动扩展 - 整合在线服务与离线分析 - 生态系统支持(监控、日志等) - 细粒度资源隔离 2. **Spark在Kubernetes中的差距** - 动态资源分配 - 外部shuffle服务 - 资源预留 - 作业抢占 3. **Volcano解决方案** - **Volcano**:一个基于Kubernetes的原生批量作业系统。 - 提供资源公平共享、动态资源分配等功能,优化了大数据任务的运行效率。 - 官网:[https://volcano.sh](https://volcano.sh) - GitHub:[http://github.com/volcano-sh/volcano](http://github.com/volcano-sh/volcano) 4. **未来工作** - 持续优化Volcano功能,支持更多大数据场景。 ## 架构师成长路径指南 - **初级**:微服务架构、MySQL实战 - **中级**:Linux性能优化、Spring Boot与Kubernetes - **高级**:微服务架构实战、云原生微服务实践 ## 联系方式 如需了解更多信息或购买课程,请联系客服「豆包」: - 电话:13167596032 - 批量购课优惠:总价满¥1000,享8折优惠。 --- 总结:本次会议重点探讨了Kubernetes在大数据工作负载中的应用,提出了Spark on Kubernetes的优势与不足,并介绍了Volcano作为Kubernetes原生批量系统的解决方案。同时,会议还提供了架构师成长路径的指南和相关课程资源。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 18 页请下载阅读 -
文档评分
请文明评论,理性发言.