微服务环境下的系统治理与容错## 微服务环境下的系统治理与容错 王新栋  ## 收获国内外一线大厂实践 与技术大咖同行成长 ✓ 演讲视频 ✓ 干货整理 ✓ 大咖采访 ✓ 行业趋势 关注 QCon 公众号  ## TABLE OF CONTENTS 大 纲 - 微服务架构 • 治理 • 容错 • 总结  ## 微服务架构 ## Ops的原则和实践,在组织结构上实现跨职能的自治团队,这必不可少。 还必须记住:实现微服务架构并不是你的目标。你的目标是加速大型复杂应用程序的开发。 --Chris Richardson ## 容错 ## 故障和问题 ☐ 故障: ITIL对故障的定义:不符合服务的运营标准且引发了或者可能引发服务中断或服务质量下降的事件。 1. 可能是造成了停机的事件 任何降低了服务质量的事件 2. 也可能是造成对最终用户响应慢的事件0 码力 | 45 页 | 16.09 MB | 2 年前3
Service Mesh的思考及在华为云的实践注册发现 客户端发现 根据请求特征引流 可定制负载均衡策略 服务发现 客户端负载均衡 可定制负载均衡算法 跨语言通信 RPC Http 多语言 重试与backoff退让算法 容错 每种语言的微服务SDK 隔离 微服务架构需要解决的问题 分布式调用链追踪 错误率 metric数据上报 时间窗 熔断 监控 可定制Metric数据 手动隔离 日志收集 服务调用层级不要超过3层 若调用层级超过2层,业务代码想要用上调用链追踪需要将TraceID转发 - 想要根据某些业务数据进行路由的话,将数据放在请求的header当中 业务开发期不要上云后就打开容错功能,容错会掩盖业务问题 ## Take Away • 一个商用级SERVICE MESH服务的设计之道 • Service Mesh在华为云的实践 华为云CSE无“微”不至助力文思海辉玩转微服务 ##0 码力 | 29 页 | 1.55 MB | 2 年前3
Spark 简介以及与 Hadoop 的对比启动计算的动因。 #### 1.2.3 血统 (Lineage) 利用内存加快数据加载,在众多的In-Memory类数据库或Cache类系统中也有实现,Spark的主要区别在于它处理分布式运算环境下的数据容错性(节点实效/数据丢失)问题时采用的方案。为了保证RDD中数据的鲁棒性,RDD数据集通过所谓的血统关系(Lineage)记住了它是如何从其它RDD中演变过来的。相比其它系统的细颗粒度的内存数据更新级 场合,但同时相比细颗粒度的数据模型,也带来了性能的提升。 RDD 在 Lineage 依赖方面分为两种 Narrow Dependencies 与 Wide Dependencies 用来解决数据容错的高效性。Narrow Dependencies 是指父 RDD 的每一个分区最多被一个子 RDD 的分区所用,表现为一个父 RDD 的分区对应于一个子 RDD 的分区或多个父 RDD 的分区对应于一个子 方法对与输入节点完好,而输出节点宕机时,通过重新计算,这种情况下,这种方法容错是有效的,否则无效,因为无法重试,需要向上其祖先追溯看是否可以重试(这就是 lineage,血统的意思),Narrow Dependencies 对于数据的重算开销要远小于 Wide Dependencies 的数据重算开销。 #### 1.2.4 容错 在 RDD 计算 ,通过 checkpoint 进行容错 ,做 checkpoint 有两种方式0 码力 | 3 页 | 172.14 KB | 2 年前3
Fault-tolerance demo & reconfiguration - CS 591 K1: Data Stream Processing and Analytics Spring 20200 码力 | 41 页 | 4.09 MB | 2 年前3
C++ in the Cloud0 码力 | 14 页 | 609.86 KB | 1 年前3
使用Chaos Mesh来保障云原生系统的健壮性-周强 0 码力 | 28 页 | 986.42 KB | 1 年前3
超大规模高可用性云端系统构建之禅-蔡超0 码力 | 40 页 | 6.52 MB | 2 年前3
Go 构建大型开源分布式数据库技术内幕0 码力 | 44 页 | 649.68 KB | 2 年前3
QCon北京2017/支撑海量业务的互联网架构/知乎基于 Kubernetes 的 Kafka 平台探索和实践Kubernetes 的 Kafka 平台实践 ## Apache Kafka Producer Broker Broker Broker Consumer 分布式的流式数据平台 高吞吐 容错性 Producer Topic Topic Topic Consumer ## Kafka 在知乎的应用 平台承载知乎业务日志、数据传输和消息队列服务 平台线上稳定运行 基于 Kubernetes 76b324fd/p26_2.jpg) ## 容错 ## 磁盘容错 - 磁盘故障不可避免 - 快速恢复 服务器预留备用磁盘 单盘故障启用备用盘 容器挂载目录  ## 主机容错 • 优化磁盘调度算法 - 运用 Kafka 机架感知特性 标准客户端,降低集群风险 Kafka 集群  ## 集群容错 • 灾备集群 • 保证重要 Topic 高可用 • 客户端与服务器注册联动 灾备集群 Consul 客户端 在线集群 ## 监控 ||指标维度|举例| |---|---|---|0 码力 | 34 页 | 2.64 MB | 2 年前3
1.8 Go微服务实战持续集成和交付 运维体系 高可用 隔离超时限流降级容错 高可用 ’ alt=‘OCR图片’/> 高可用 隔离超时限流降级容错 高可用 ’ alt=‘OCR图片’/> 高可用 隔离超时限流降级容错 高可用 ’ alt=‘OCR图片’/> 高可用 隔离超时限流降级容错 高可用 ’ alt=‘OCR图片’/> 高可用 隔离超时限流降级容错 高可用 ’ alt=‘OCR图片’/> Agenda0 码力 | 57 页 | 3.24 MB | 1 月前3
共 205 条
- 1
- 2
- 3
- 4
- 5
- 6
- 21













