深入 Kubernetes 的无人区-蚂蚁金服双十一的调度系统分钟级 链路切换 数万核 CPU资源节省 100% 分时切换成功率11/19 计算型任务混部 Part 2:双十一 Kubernetes 实践 其他自研 Operators AI 训练 Kubernetes TensorFlow PyTorch Horovod/mpi XGBoost Spark SparkApplication Spark Operator 在线应用0 码力 | 19 页 | 2.18 MB | 6 月前3
SOFAMOSN持续演进路径及实践分享log Ø IO、协议、前后端核心 metrics技术案例 – 协议自动识别 TLS链接 核心实现思路: Ø TLS通过ALPN来识别。 Ø TLS不带ALPN或者明文,通过预读首部字段识别。 ALPN扩展 预读字段 是 否 获取ALPN协商 所得协议 有 无 遍历所有协议 实现,执行 ProtocolMatch 返回AGAIN 匹配成功,获 取对应协议 无法识别协议,0 码力 | 29 页 | 7.03 MB | 6 月前3
七牛容器云ServiceMesh实践测试环境不稳定,后端Pod 频繁重启 • 解决方案 • Contour产品化 • Istio的灰度发布和流量管理 • Istio的Tracing产品化落地场景—云存储系统 • 历史问题 • 灰度发布 • 预上线系统验证体系 • 系统故障隔离 • 跨集群访问 • 线上问题链路追踪 • 解决方案 • Istio南北流量分流策略产品化 • 基于Istio的QoS产品化 • 跨集群流量调度 • 基于Isti0 码力 | 15 页 | 3.86 MB | 6 月前3
Service Mesh 在『路口』的产品思考与实践蚂蚁金服的产品实践18/39 Part 3: 蚂蚁金服的产品实践 发展历程 全面大规模落地 2017年底开始调研并探 索 Service Mesh 技术, 并确定为未来发展方向 技术预研 01 2018年初开始用Golang 开发 Sidecar SOFAMosn, 年中开源基于 Istio 的 SOFAMesh 技术探索 02 2018年开始内部落地,第一0 码力 | 40 页 | 15.86 MB | 6 月前3
Service Mesh的实践分享agent Proxy App Smart agent Alarm center Analysis plugin全链路服务综合治理 • 现状 • 链路上某些节点的配置不合理,很难被预 先发现 • 如整条调用链入口要求的超时是500ms,然而 中间某个服务的超时时间是5s。超时时间的严 重差异容易造成资源浪费(上游超时返回了下 游还继续往下调)和数据不一致风险(上游以 为写失败了下游却写成功了)0 码力 | 30 页 | 4.80 MB | 6 月前3
共 5 条
- 1













