MySQL 数据库架构灾难恢复解决方案Solutions!  RPO = 0 RTO = seconds (自动故障转移) ## 2016 - MySQL InnoDB Cluster - MySQL 组复制: 自动成员身份更改、网络分区处理、一致性... • MySQL Shell Solutions!  RPO != 0 RTO = minutes (manual failover) ## 2020 - MySQL InnoDB Replicaset "经典"、"异步"的基于复制的解决方案,完全集成 [Image](/uploads/documents/4/1/b/f/41bf4e9c6607aa3e903e68d7ea1e501d/p10_1.jpg) RPO = 0 RTO = 秒级 (自动故障转移) 灾难恢复(区域故障) RPO != 0 RTO = 分钟或更长时间(手动故障转移) 无写入性能影响 ## 特点 简单易用 - 熟悉的界面和可用性 mysqlsh, CLONE, ... 在线添加/删除节点/集群0 码力 | 52 页 | 3.07 MB | 2 年前3
openEuler 23.09 技术白皮书应的优化方式,按照用户的要求进行优化,并将优化好的二进制存储在“.rto”后缀的文件中。 目前 sysBoost 只支持优化 bash,且会默认开启优化;后续会开放更多应用。 ## rto 二进制加载内核模块 我们希望 sysBoost 优化的过程对用户无感知。考虑到应用升级、异常回退等场景,我们无法直接用优化后的“.rto”文件替换原文件,而是采用新增二进制加载模块的方法,在内核加载二进制时自动加载优化的二进制。 加载函数,该函数会检查待加载的二进制文件对应的 inode 中是否有 sysBoost 写入的特殊标记,如果有,则会加载优化过的“.rto”文件;没有则按原流程进行加载。 这个加载机制依靠 inode 中的特殊标记来识别应用是否被 sysBoost 优化,因此 sysBoost 优化流程在生成“.rto”文件时,都会在通过本内核模块将该标记置上。设置标记的方式是新增一个设备文件,用户态通过 ioctl 系统调用通知本内核模块进行设置。0 码力 | 52 页 | 5.25 MB | 1 年前3
NJSD eBPF 技术文档 - 0924版本[Image](/uploads/documents/6/c/0/1/6c01327bb5df49cd2bce19fc844f8319/p13_1.jpg) ## 配置TCP Initial RTO - 场景 内核4.12之前 initial RTO是一个常数1s - 应用类型BPF_PROG_TYPE_SOCK_OPS • HOOK BPF_SOCK_OPS_TIMEOUT_INIT • 内核中调用栈 • 9999: Flags [S], seq 281070166, ... length 0 # +16s __section("sockops") int set_initial_rto(struct bpf_sock_ops *skops) { int timeout = 3; int hz = 250; // grep 'CONFIG_HZ='0 码力 | 20 页 | 7.40 MB | 1 年前3
分布式NewSQL数据库TiDB服务,此解决方案存在以下缺点:资源利用率低、维护成本高、RTO(Recovery Time Objective)及RPO(Recovery Point Objective)无法真实达到企业所期望的值。TiDB采用多副本+Multi-Raft协议的方式将数据调度到不同的机房、机架、机器,当部分机器出现故障时系统可自动进行切换,确保系统的RTO $ \leq $ 30s及RPO=0。 ## 对存储容0 码力 | 120 页 | 7.42 MB | 1 年前3
PingCAP TiDB&TiKV Introduction OLTP|MySQL|没有原生的安全的同步方案| |NewSQL \| TiDB|简单配置即可保障所有的数据中心100%同步,真正意义上的多活完全实现国标(信息安全技术-信息系统灾难恢复规范GBT 20988-2007)最高等级第六级的要求(RTO=0,RPO=0)| ## NewSQL - 大数据量下高压力实时处理的完美解决方案 随着业务增长,需要处理的数据量不断增加,系统架构师面临多种挑战: ● 传统的關系型數據庠無法滿足高並發写入?0 码力 | 21 页 | 613.54 KB | 1 年前3
全球开源发展态势洞察(2023年第八期)nix Data Services for Kubernetes。具体功能如下: - NDK为Kubernetes应用提供数据保护、恢复、迁移、克隆和复制等管理功能; - 支持将恢复时间目标(RTO)和恢复点目标(RPO)从几天缩短到几分钟; - 提供策略驱动的有状态应用管理; - Kubernetes和IT管理员可以通过制定规则和限制来管理基础设施,并启用自助式工作流程。 ### Mirantis发布轻量级0 码力 | 22 页 | 1.99 MB | 2 年前3
为何选择VMware?Boise Inc. 高级 IS 工程师 通过使用 VMware vCenter Site Recovery Manager 管理从生产数据中心到备份站点的故障切换,帮助达到您的恢复时间目标 (RTO) 和遵从性要求。通过将两个站点设置为彼此的恢复站点来管理两个活动站点之间的故障切换。甚至数据中心迁移等情景下的计划内数据中心故障切换也可以通过 VMware vCenter Site Recovery0 码力 | 34 页 | 862.76 KB | 2 年前3
TiDB v6.5 Documentationsolution has the disadvantages of low resource utilization, high maintenance cost, and the fact that RTO (Recovery Time Objective) and RPO (Recovery Point Objective) cannot meet expectations. TiDB uses multiple and machines. When some machines fail, the system can automatically switch to ensure that the system RTO 30 seconds and RPO=0. ## Massive data and high concurrency scenarios with high requirements for storage one TiKV can reach 9 MiB/s, which is 50% faster than before. The restore speed is scalable and the RTO in DR scenarios is reduced greatly. The RPO in DR scenarios can be as short as 5 minutes. In normal0 码力 | 5282 页 | 99.69 MB | 2 年前3
TiDB v7.1 中文手册金融行业对数据一致性及高可靠、系统高可用、可扩展性、容灾要求较高。传统的解决方案的资源利用 率低,维护成本高。TiDB 采用多副本 + Multi-Raft 协议的方式将数据调度到不同的机房、机架、机器,确 保系统的 RTO <= 30s 及 RPO = 0。 31 • 海量数据及高并发的 OLTP 场景 传统的单机数据库无法满足因数据爆炸性的增长对数据库的容量要求。TiDB 是一种性价比高的解决方 案,采用计算 对比不同的容灾解决方案。 8.4.1.1 基本概念 • RTO (Recovery Time Objective):是指灾难发生后,系统恢复服务所需的时间。 • RPO (Recovery Point Objective):是指灾难发生后,确保对业务不产生损失的前提下,可以丢失的最大数据 量。 733 下面的图形描述了这两个概念: 图 57: RTO and RPO • 错误容忍目标:由于灾难可能影响的地域范围是不同的,在本文中,使用 两个集群之间通过 TiCDC 进行数据改变的同步。这种架构,简称为 “1:1” 解决方案。 这种架构看起来非常简洁,可用性比较高,最大的错误容忍目标可以做到区域级别,写能力也能够得到扩展, RPO 在秒级别,RTO 在分钟级别,甚至更低。如果 RPO 为 0 并不是必须满足的要求,推荐在重要生产系统使用 该容灾方案。对于该方案的详细信息,请参考基于主备集群的容灾方案。 8.4.1.3.2 基于多副本的单集群容灾方案0 码力 | 4369 页 | 98.92 MB | 2 年前3
TiDB v6.5 中文手册众所周知,金融行业对数据一致性及高可靠、系统高可用、可扩展性、容灾要求较高。传统的解决方案是同城两个机房提供服务、异地一个机房提供数据容灾能力但不提供服务,此解决方案存在以下缺点:资源利用率低、维护成本高、RTO(Recovery Time Objective)及RPO(Recovery Point Objective)无法真实达到企业  所期望的值。TiDB采用多副本+Multi-Raft协议的方式将数据调度到不同的机房、机架、机器,当部分机器出现故障时系统可自动进行切换,确保系统的RTO<=30s及RPO=0。 ## 对存储容量、可扩展性、并发要求较高的海量数据及高并发的OLTP场景 随着业务的高速发展,数据呈现爆炸性的增长,传统的单机数据库无法满足因数据爆炸性的增长对数 [@joccau](https://github.com/joccau) PITR恢复的日志恢复阶段,单台TiKV的恢复速度可以达到9MiB/s,提升了 50% ,并且恢复速度可扩展,有效地降低容灾场景的RTO指标;容灾场景的RPO优化到5分钟,在常规的集群运维,如滚动升级,单TiKV故障等场景下,可以达到RPO=5min的目标。 












