课程名称:课程版本(101/201/301)+ 3.9.4 Mutil Site Disaster Recovery(TiDB 跨数据中心部署方案)
学习时长:10
课程内容:
-
哪些故障会导致数据丢失
- 某些region 的全部副本在故障中丢失
- 某些region 的大部分副本在故障中丢失 而剩余的副本没有 最新数据的写入
-
导致丢失原因
- sync-log 参数未开启
- TIKV label 未设置
-
故障恢复前
-
大部分副本丢失,但部分region 健在的恢复
- 关闭PD 调度
- 找到超过一半副本故障的region 并记录id
- 设置这些region 为tombstone 取消tikv 节点启动时对这些的检查
- 删除上述的错误peer
- 检查未有leader 的region
- 对上述region 设置空region 避免 region Unavailable 报错
- 最好的方式 业务重试
- 关闭PD 调度
学习过程中遇到的问题或延伸思考:
- 问题 1:
- 问题 2:
- 延伸思考 1:
- 延伸思考 2: