集群 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

微服务和Service Mesh 在多个行业落地实践

www.163yun.com 设计要点十一：全链路监控 www.163yun.com 设计要点十二：全链路压测 www.163yun.com 微服务平台总览容器平台 (多集群基础设施) Pod & Deployment 网络 Calico, OVS 存储 Ceph 滚动更新弹性伸缩日志中心基础设施监控开发集群测试集群 com 开发集群测试集群 CICD (开发流程管理) 流水线管理代码检出代码编译镜像构建集成测试部署测试平台 (集成，场景测试) 单接口用例场景用例执行集定时执行接口 Mock 覆盖率生产镜像仓库测试镜像仓库历史管理批量导入接口监控生产集群镜像中台化容器化注册发现 www.163yun.com 网易容器平台优势集群规模大：30000+节点生产检验时间长：国内首个K8S公有云容器平台稳定运行1000+天全球首批通过K8S一致性认证基于OVS的网络性能优化基于Ceph的存储性能优化多集群统一管理 www.163yun.com 某物流企业 www.163yun.com 线上

0 码力 | 39 页 | 3.06 MB | 1 年前
3
从百度文件系统看大型分布式系统设计中的定式与创新

百度文件系统BFS - 万亿量级实时数据库Tera - 集群调度系统Galaxy • 个人主页&Blog - https://github.com/bluebore - http://bluebore.cn 提纲 • 百度文件系统简介 • 分布式系统设计实践 • 总结与致谢百度的集群环境 • 单个集群通常几千台机器 • 百度文件系统(BFS)、集群调度系统（Galaxy）、分布式协调服务（Nexus）是核心服务 master BFS master Nexus lock service 分布式软件栈中的BFS The Baidu Stack 网络通信框架Sofa-pbrpc 分布式文件系统 BFS 集群调度系统 Galaxy 分布式协调服务 Nexus 分布式数据库 Tera 分布式计算框架 Shuttle Apps(Spider/Index/Search) 数据中心操作系统(DCOS)

0 码力 | 24 页 | 937.45 KB | 1 年前
3
高可用分布式流数据存储设计-李玥

IOThreads 收到复制响应 Pending Callbacks ResponseThreads 发送响应 Journal Cache Journal Files 线程模型集群 · 架构没有最好的架构，只有最合适的架构取 · 舍学会⽅得始终取舍从实用角度出发，如何取舍？ Consistency ⼀一致性 Availability 可⽤用性⼤大促限流 Complexity 复杂度 Apache ZooKeeper “程序员都喜欢ZooKeeper，但用户正相反” 可维护性问题多机房部署时可⽤用性问题数据容量量有限，集群规模有限选举恢复速度慢，不不可⽤用时间较⻓长 John Ousterhout Diego Ongaro “In search of an understandable consensus 牺牲可⽤用性换取⼀一致性性能⼀一般集群规模不不能太⼤大 Raft总结读请求分流顺序⼀一致已提交位置之前的⽇日志具有不不变性。对于提交的⽇日志，相同位置上Follower的⽇日志和Leader上是⼀一样的。强⼀一致如果两个节点上的⽇日志完全相同，并且这些⽇日志都已经被状态机执⾏行行，那么这两个节点的状态是相同的。集群节点数越多性能越好吗？ NO 引⼊入Observers

0 码力 | 36 页 | 6.02 MB | 1 年前
3
分布式 KV 存储系统 Cellar 演进之路

固定HASH算法固定数目数据分片桶->存储节点对照表 Cellar起源—Tair架构服务层请求 mdb 响应 ldb fdb rdb 引擎层迁移复制 • 中心化集群问题 • 可用性问题 • 性能问题 • 运维问题 Cellar起源—Tair问题 Cellar起源架构升级性能优化可用性优化可运维性 Cellar 开源 Tair • Cellar起源回写增量log 分片2复制分片2复制分片1复制客户端分片1&2 log Cellar—异地容灾 • 多机房建设网络延迟大专线稳定性差 • 异地容灾需求跨集群数据同步 Cellar—异地容灾集群节点同步消息队列同步复制延迟低高系统复杂度低高运维成本低高实现难度高低扩展性低高 • 低延迟 • 低复杂度（运维成本） Cellar—异地容灾

0 码力 | 34 页 | 1.66 MB | 1 年前
3
QCon北京2018-业务高速发展下的互联网金融系统架构演变-张现双+

AND/IOS/H5/Open 静态站网贷服务借款流程 Cache集群安全加密网贷服务 CDN 支付结算订单 DB从批处理系统活动 DB主 DB从版本管理产品 ... 同步 …... 网站、基础服务移动后台业务和团队规模迅速扩张粗粒度服务化，基础设施完善 CDN/页面缓存/静态站/缓存集群移动后台旁路流程double，冗余开始出现智能DNS，DNS负载均衡限流(limit,lua)，openresty，4层/7层LB 弹性扩容，限流(token)，熔断，防刷降级，熔断，弹性扩容多IDC，区域容灾，多ISP 集群，高可用，分片本地缓存，防刷，流控终端域名机房 LB / NG.. 网关 Cache 服务抓大不能放小[细节决定成败] 线程阻塞>300 中间件内存管理、线程状态，连接状况

0 码力 | 42 页 | 19.96 MB | 1 年前
3
唯品会调度系统的前世今生

部署模型(跨机房) IDC-A IDC-B 接入域-A 执行结点作业实现 ZK saturn-zk-* saturn.vip.com 控制台集群 (Tomcat) ZK Observe r ob-saturn-zk-* 2台 3台 x台调度器集群接入域-B 执行结点作业实现功能地图 01 02 03 多种作业类型与作业模式资源动态平衡框架与业务隔离三大功能特性 Executor 作业实现 Saturn Core JVM System Class Loader Job Class Loader Call 类加载作业运行基本原理更多。。。超时控制多ZK集群支持监控体系手动触发批量处理强行终止 Dashboard … 为什么需要容器化资源利用提高物理资源的利用率系统弹性资源弹性伸缩运维效率上线周期、峰值应对作业隔离

0 码力 | 58 页 | 5.40 MB | 1 年前
3
领域驱动设计&中台/淘宝应用架构升级——反应式架构的探索与实践

应⽤用实施升级  * 聚焦性能做 case  * 补⻬齐设施能⼒力力  * 积累业务升级改造经验  2. 架构级升级  * 规模化后，架构级别收益会显现业务架构升级case 的选择策略略 1. 集群/流量量⼤大/核⼼心有认知  * ⽅方便便看升级改造效果 2. 瓶颈 match 升级  (如 CPU 压不不满、IO较多、⾼高Load)  * 可以确定获得⼤大⽐比例例收益 3. 业务逻辑简单优先  已统⼀一接⼊入⽬目标与规划 • 实现分布式回压(backpressure) • 保证整体系统稳定不不过载且充分利利⽤用资源 • 2018双11有试点实验，后续重点  •通过回压把应⽤用集群压⼒力力反馈到基础设施 • 更更精准有效的应⽤用弹性调度 •实现全异步/流式为核⼼心的服务框架 • 考虑引⼊入 Kotlin 协程 •符合现在过程式的编程习惯（⾮非 FP ⻛风格）

0 码力 | 27 页 | 1.13 MB | 1 年前
3
声明式自愈系统——高可用分布式系统的设计之道-王昕

State u 创建1个新的Pod Ø Controller观察特定领域的系统状态 Ø 协调Desired State跟 Realized State之间的差距，维持最终一致性 Ø 定期处理集群中的事件 Ø 系统必须是幂等的控制器的设计理念控制逻辑应该只依赖于当前状态假设任何错误的可能，并做容错处理尽量避免复杂状态机，逻辑不要依赖无法监控的内部状态每个模块都可以在必要时优雅地降级服务逻辑正确性不能依赖缓存，写操作服务端必须有校验而且幂等，没有缓存情况下系统仍可服务 Ø 错误回复缓存，过期时间不能太长，而且有清晰的修复建议 Ø 数据库更新与缓存失效的策略最佳实践分享有关配置文件 Ø 集群使用统一的配置来源 Ø 定义正常的默认配置，满足读取不到配置的正常运行 Ø 支持可扩展的配置命令格式 Ø 尽量支持更改配置不需要重启服务 Ø 注意配置项之间的关联性欢迎与我交流王昕个人微信

0 码力 | 44 页 | 2.47 MB | 1 年前
3
领域驱动设计&中台/物联网平台的反应式设计

SaveShadow CalcDelta UpdateDelta SyncDelta Web Console 问题及应对之道灵活性弹性资源竞争 • 每次局部业务更更新都需要重新部署整个集群 • 局部业务性能瓶颈，弹性扩容所有业务 • 加锁处理理资源竞争，增加性能消耗微服务事件驱动我们做了了什什么 EVENT STORMING EVENT STORMING 核⼼心

0 码力 | 18 页 | 1.81 MB | 1 年前
3
联想-贺钢架构工作在国际化项目中的应用实例

可以简单通过升级服务器配置支持更多用户百万到千万增加Nginx(反向代理)或DNS负载均衡,redis内存 cache,数据库(Mysql)多台(数据在一个数据中心) 千万到亿增加Web服务器内存缓存,集群,IP负载均衡,基于内容请求分发,Mysql优化(如减少写,2/8原则),数据在一个数据中心亿以上增加异地部署(建议核心点集中,其它节点分散开),较难分割或核心数据在同一数据中心,其它分散到不

0 码力 | 53 页 | 2.36 MB | 1 年前
3

共 14 条前往

页

分类

语言

格式

微服务和Service Mesh 在多个行业落地实践

从百度文件系统看大型分布式系统设计中的定式与创新

高可用分布式流数据存储设计-李玥

分布式 KV 存储系统 Cellar 演进之路

QCon北京2018-业务高速发展下的互联网金融系统架构演变-张现双+

唯品会调度系统的前世今生

领域驱动设计&中台/淘宝应用架构升级——反应式架构的探索与实践

声明式自愈系统——高可用分布式系统的设计之道-王昕

领域驱动设计&中台/物联网平台的反应式设计

联想-贺钢架构工作在国际化项目中的应用实例