Estimation of Availability and Reliability in CurveBS0 码力 | 2 页 | 34.51 KB | 1 年前3
陈宗志:大容量redis存储方案--Pika协议、继承 Redis 便捷运维设计的前提下通过持久化存储的方式解决 Redis 在大容量场景下的问题 ## Redis 问题 - 恢复时间长 - 一主多从, 主从切换代价大 - 缓冲区写满问题 - 成本问题 ## Redis 问题 ## • 恢复时间长 – 50G redis 回复时间70分钟 – 同时开启aof 和 rdb ## Redis 问题 ## • 一主多从, 主从切换代价大 一月一个小版本, 二月一个大版本 ## Pika 开发现状 • 双主支持 • Pika hub 提供多机房写入支持 • 支持sentinel • 支持codis ## Pika 总结 - 恢复时间长 - 一主多从, 主从切换代价大 - 缓冲区写满问题 - 内存昂贵问题 ## Pika vs redis ## • 劣势 ## – 由于Pika是基于内存和文件来存放数据, 所以性能肯定比Redis低一些0 码力 | 47 页 | 2.18 MB | 2 年前3
从百度文件系统看大型分布式系统设计中的定式与创新分布式的双主问题只从存储系统解决 ## 这些设计给BFS带来哪些优势? ||HDFS|BFS| |---|---|---| |名字节点扩展方式|联邦式分裂的目录树|分布式统一的目录树| |宕机恢复时间|分钟级|秒级| |外部依赖|ZooKeeper & QJM|无| |开发语言|Java|C++| ## Q&A • 欢迎参与BFS的开发 • https://github.com/baidu/bfs0 码力 | 24 页 | 937.45 KB | 2 年前3
2022 Apache Ozone 的最近进展和实践分享扩展性提升 • 无需改变或改造业务应用代码 • 降低控制平面的节点数和服务依赖 ## 运维价值 • 降低大规模集群的运维难度 • 可通过HDFS API和Distcp进行快速迁移 • 降低系统恢复时间 - 尽可能的减少NN Java GC带来的无响应问题 计算 AI/ML HIVE/IMPALA/SPARK KAFKA / FLINK OTHER WORKLOADS  ## 自治 ## • 自动故障恢复 - 多对多,恢复时间短 • 精确的流量控制,对io几乎无影响 0 码力 | 35 页 | 2.03 MB | 1 年前3
Redis开发运维实践指南则rdb也不会被恢复进内存,此时如果有新的请求进来后则原先的rdb文件被重写。 如果只配置了AOF,重启时加载AOF文件恢复数据。 恢复速度参见新浪的测试结果: 恢复 大小(G) 恢复时间 恢复时间/G 内存 2.04 0 0 rdb 0.65 19 29.23 aof 11 508 46.18 rewrite aof 4 194 48.50 这个结果是可信的,0 码力 | 316 页 | 5.04 MB | 1 月前3
KubeCon2020/微服务技术与实践论坛/Spring Cloud Alibaba 在 Kubernetes 下的微服务治理最佳实践-方剑场景二:某应用运行过程中,某几台机器由于磁盘满,或者是宿主机资源争抢导致load很高,客户端出现调用超时。 客户端摘除 • 实时性高 - 需要关注错误率阈值、隔离机器的比例阈值,及被摘除后恢复时间 • 更灵活的摘除策略:调整权重 全局摘除:监管控一体 • 维度更加丰富 摘除后动作 • 弹性扩容替换故障机器  ## 自动故障恢复 Curve可在多种软硬件故障场景(如单mds故障、单ChunkServer故障、硬盘故障、网络丢包等)实现自动恢复,保障存储服务高可用性。 ☐ 多对多,恢复时间短 ☐ 精确的流量控制,对io影响很小 Kill一个节点所有ChunkServer进程 












