微服务容灾治理## 微服务容灾治理 ### 1. go-zero 稳定性能力概览 经过这么多年大流量服务端架构设计的沉淀,go-zero 在保护服务的稳定性上下足了功夫,不管是 CPU 密集型还是 IO 密集型服务,go-zero 都能很好的保护服务在如下场景不被拖垮或卡死: 远超服务容量的突发大流量 CPU 打满 • 上下游故障或者超时 • MySQL、MongoDB、Redis 等中间件故障或者超负载(典型的是 6113db2ae442f78/p1_1.jpg) 如图,我们从三个方面来保护系统的稳定性: 服务端自适应过载保护 服务端自适应熔断 • 客户端自适应熔断 当然,我们还有自动适配后端服务能力的负载均衡算法,对稳定性进一步保驾护航。本文主要讲解自适应过载保护的原理、场景和表现。 ### 2. 自适应过载保护压测 用过 Windows 的同学对这个界面应该都不陌生,这就是典型 CPU 打 的过载保护 CPU 阈值,否则可能会抑制 HPA 的生效。 当然整个系统并不是链路上所有服务和中间件都可以自动或及时扩容的,这里就牵出另一个稳定性能力 - 自适应熔断了。有了自适应过载保护和自适应熔断的双重加持,流量再大(上限是所有 CPU 都用在降载熔断等能力上),服务也不会挂。后续文章我会深度分析自适应熔断的场景压测和实现原理。 ### 1. 总结 自适应过载保护的算法有如下要点: - CPU0 码力 | 13 页 | 1.68 MB | 2 年前3
金融级云原生 PaaS 探索与实践王成昌(晙曦)蚂蚁金服技术专家 ## 目录 contents 一、业务背景 二、多集群管控 三、发布运维体系 ## 一、 业务背景 ## 业务架构 演进 容量 应用|数据库|机房 容灾 机房|地域  ## 业务架构 单元化 业务敏捷 SaaS 面向站点级别输出 ## PaaS 能力 面向多租户多环境; • 基础资源管控; • 应用发布运维体系; • 业务实时监控,日志收集; • 机房级和地域级容灾能力; ## 云原生 PaaS 产品架构方案 业务架构 同城双活架构 两地三中心架构 异地多活架构 产品层 跨机房和地域统一应用运维 分钟级容灾切换和恢复 全面变更风险管理 无限弹性可扩展 核心流程 灰度分组发布 容器腾挪/迁移 中间件变配 (DRM/Scheduler/Message) 容灾切换和恢复 Mesh流调拨和治理 应急预案管理 ... ## 基础发布运维 批次发布 原生资源管理 Pod伸缩管理 集群伸缩管理 容器镜像管理 运维原子操作 ## 单元化能力 变更管控 接入层流程调拨 配额管理 精细化调度 数据层流量调拨 单元化 元数据管理0 码力 | 20 页 | 1.71 MB | 1 年前3
1.6 利用夜莺扩展能力打造全方位监控系统## GCN ## 利用夜莺扩展能力打造全方位监控系统  喻波 滴滴 专家工程师  展示,完备性看采集能力,是否能够兼容并包,纳入更多生态的能力,至关重要 ## 夜莺数据采集 - 支持在web上配置采集策略,不同的采集可以指定不同的探针机器、目标机器,便于管理和知识传承 - 独创在端上流式读取日志,根据正则提取指标的机制,轻量易用,无业务侵入性 - 内置集成了多种数据库中间件的采集以及网络设备的采集,复用telegraf和datadog-agent的能力 - 支持stat0 码力 | 40 页 | 3.85 MB | 2 年前3
大规模分布式系统架构下调测能力构建之道jpg) QCon 全球软件开发大会 INTERNATIONAL SOFTWARE DEVELOPMENT CONFERENCE BEIJING 2017 # 大规模分布式系统架构下调测能力构建之道 天弘基金 李鑫 主办方 Geekbang. InfoQ ## 促进软件开发领域知识与创新的传播   ## 应用服务综合mock能力 ## 在实际应用场景中,应用所依赖的服务往往很分散: 1. 一部分依赖服务从本机的Runtime环境即可获取, 2 一部分需要从协同团队的远程开发机上临时获取(联调模式), 3 一部分服务0 码力 | 19 页 | 2.74 MB | 2 年前3
分布式 KV 存储系统 Cellar 演进之路存储系统研发 有多年分布式存储研发经验 ## 目录 - Cellar起源 - 中心节点架构演进 - 节点高可用和异地容灾 - 服务可用性提升 - Cellar规划 ## 目录 - Cellar起源 - 中心节点架构演进 - 节点高可用和异地容灾 - 服务可用性提升 - Cellar规划 ## Cellar起源 Cellar,英文原意是酒窖,项目取名Cellar ## Cellar起源 ## 开源 Tair 架构升级 可用性优化 性能优化 可运维性 Cellar ## 目录 - Cellar起源 - 中心节点架构演进 - 节点高可用和异地容灾 - 服务可用性提升 - Cellar规划 ## Cellar—中心节点架构演进 - 性能问题 客户端集中获取路由表 - 隔离性问题 中心节点暴露给客户端  单独的路由表获取模块 ## Cellar—中心节点架构演进 - 可扩展性: 路由查询能力 可线性扩展 - 隔离性: 客户端与中心节点 完全隔离 # 云原生安全威胁分析与 能力建设白皮书 中国联通研究院 中国联通网络安全研究院 下一代互联网宽带业务应用国家工程研究中心 2023年11月 ## 版权声明 本报告版权属于中国联合网络通信有限公司研究院,并受法律保护。转载、摘编或利用其他方式使用本报告文字或者观点的,应注明“来源:中国联通研究院”。违反上述声明者,本院将追究其相关法律责任。 ## 目录 一、云原生安全概述.....9 4.2 攻击过程复现 ..... 45 四、云原生应用保护能力建设 ..... 47 4.1 制品安全能力建设 ..... 47 4.1.1 代码安全 ..... 48 4.1.2 镜像安全 ..... 49 4.1.3 制品环境安全 ..... 50 4.1.4 安全检测 ..... 52 4.2 运行时安全能力建设 ..... 53 4.2.1 Web 应用和 API API 安全 ..... 54 4.2.2 云原生运行时安全 ..... 56 4.2.3 网络微隔离 ..... 58 4.3 基础设施安全能力建设 ..... 59 4.3.1 基础设施即代码安全 ..... 59 4.3.2 权限管理 ..... 60 4.3.3 云原生安全态势 ..... 60 五、总结与展望 ..... 62 六、参考文献 ..... 64 ##0 码力 | 72 页 | 2.44 MB | 2 年前3
TiDB 开源分布式关系型数据库构建金融业新一代运维监控平台 30 PayPay - 从 AWS Aurora 迁移到 TiDB 的最佳实践 32 5.2 能源 国网河北电力 - 利用 TiDB 打造电力企业全场景数据服务能力 34 5.3 物流 中通快递 - 从 Exadata 到 TiDB HTAP 的升级之路 37 5.4 零售 多点DMall - TiDB 助力新零售“业财一体化”运营 是一款同时支持在线事务处理与在线分析处理 (Hybrid Transactional and Analytical Processing, HTAP) 的开源分布式关系型数据库产品,具备水平扩容或者缩容、金融级高可用、实时 HTAP、云原生的分布式数据库、兼容 MySQL 5.7 协议和 MySQL 生态等重要特性,向用户提供一站式 OLTP、OLAP、HTAP 解决方案,适用于对高可用、一致性要求高、数据规模较大等应用场景。 ments/3/d/e/b/3deb0740caa715d2156ad7d85aa695c6/p12_1.jpg) ## 一 键水平扩容或者缩容 得益于 TiDB 存储计算分离的架构的设计,可按需对计算、存储分别进行在线扩容或者缩容,扩容或者缩容过程中对应用运维人员透明。  数据来源:智研咨询 加强对配送骑手的管控能力 提升配送全业务的运营效率,降低成本 业务团队:招聘、采购、物料、培训、薪酬、保险... 运营团队:运力结构、经营分析、绩效考核... 客服团队:问题跟进、定责... ## 履约SLA要求高,重线下业务运营 初期造工具,解决能不能  长期造壁垒,实现降维打击能力 ## Agenda 01 美团配送业务介绍 02 MVP阶段 03 规模化阶段 04 精细化阶段 ## 从零到一 MVP阶段 业务从零到一 快速迭代、业务试错 ![0 码力 | 31 页 | 15.26 MB | 2 年前3
Nacos架构&原理
年的阿里五彩石项目,自主研发完全可控,经历十多年双 11 洪峰考验,沉淀了高性能、高可用、可扩展的核心能力,2018 年开源后引起了开发者的广泛关注和大量使用。本书也将介绍 Nacos 偏 AP 分布式系统的设计、全异步事件驱动的高性能架构和面向失败设计的高可用设计理念等。相信开发者阅读后不仅可以更深入了解 Nacos,也有助于提高分布式系统的设计研发能力。 ## 阿里巴巴中间件负责人 - 胡伟琪(白慕) 阿里巴巴在 10 和对该领域感兴趣的技术爱好者阅读。 ## Facebook 工程师 & CNCF 前 TOC 成员 - 李响 服务注册、发现与配置管理是构成大型分布式系统的基石。Nacos 是集成了这三种能力的现代化、开源开放的代表系统。本书系统化的介绍了 Nacos 诞生的历史背景以及其在阿里集团内部孕育的过程,阐述了打造一款实用、易用系统的全过程。另外,本书也从设计、架构方面详细介绍了 Nacos 的实现,分享了 靠性,可观测性等分布式系统指标影响整个分布式系统的运行。历史上,这个系统在阿里也触发过大故障,经历过数次血与火的考验。在阿里数次架构升级中,Nacos 都做了大量的功能迭代,用来支持阿里的异地多活,容灾演练,容器化,Serverless 化。Nacos 经过阿里内部锤炼十年以上,各项指标已经及其先进,稳定,为服务好全球开发者,Nacos 经过数十名工程师持续努力,以开源形式和大家见面,相信 Nacos0 码力 | 326 页 | 12.83 MB | 1 年前3
2022年美团技术年货 合辑自动化测试在美团外卖的实践与落地 483 深入理解函数式编程(上) 512 深入理解函数式编程(下) 541 Android 对 so 体积优化的探索与实践 568 从 0 到 1:美团端侧 CDN 容灾解决方案 589 美团高性能终端实时日志系统建设实践 608 后端 622 可视化全链路日志追踪 622 设计模式二三事 647 基于代价的慢查询优化建议 670 Java 系列 数字化新业态下数据安全创新——Token 化 1277 Linux 中基于 eBPF 的恶意利用与检测机制 1293 如何应对开源组件风险?软件成分安全分析(SCA)能力的建设与演进 1328 # 算法 # YOLOv6:又快又准的目标检测框架开源啦 作者:楚怡 凯衡 等 ### 1. 概述 YOLOv6 是美团视觉智能部研发的一款目标检测框架,致力于工 搭建,采用了多分支的方式和残差结构。对于 GPU 等硬件来说,这种结构会一定程度上增加延时,同时减小内存带宽利用率。下图 2 为计算机体系结构领域中的 Roofline Model $ ^{[8]} $ 介绍图,显示了硬件中计算能力和内存带宽之间的关联关系。  图 20 码力 | 1356 页 | 45.90 MB | 2 年前3
共 1000 条
- 1
- 2
- 3
- 4
- 5
- 6
- 100













