【需求涉及的问题场景】
- 灾备 RPO 要求,类似于使用 MySQL Binlog 进行 log 备份,分钟级别
- RTO 常规要求 1 小时内恢复,重大问题需要通宵恢复
【期望的需求行为】
- TiCDC 支持输出 cdc log 文件备份,BR 读取备份文件并恢复数据到某个时间点
- 组件部署在自建云上,支持从 s3 存储备份恢复功能
【需求可替代方案】
- 基于 BR 全量 + 增量备份,但增量备份没办法实时进行
【背景信息】
-
供应链业务场景,上游最大 QPS 30000
-
目前使用 TiDB binlog 同步到内部自研的 MQ ,可以容忍 1 min 左右同步延迟
-
会限制业务 Transaction 大小,不过特殊情况会超过 10G,如一些批量 update 操作,只能写脚本拆事务
-
目前通过 BR 2 天做一次全量备份,保存一个月的备份数据,有自己的运维管理平台