关于dr auto-sync故障恢复的问题

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】v7.5.0
背景:
设计tidb容灾方案是,为了兼容成本和容灾,我打算使用dr auto-sync方案:

  • 主可用区2副本,是voter
  • 备可用区2副本,角色是1个follower和1个learner

问题:

  • 主可用区全部宕机如何恢复
  • 恢复成默认的3副本模式,如何让集群不要补充副本,因为备可用区的机器数量会低于主可用区

得6副本吧,

  • 主可用区3副本,是voter
  • 备可用区3副本,角色是2个follower和1个learner
1 个赞

看一下视频303架构设计那一部分

1.主可用区不可用,集群不可用。
如果原来是正常的同步模式,那么此时rpo=0可以通过备可用区的数据来恢复集群,但是如何恢复可能需要找官方的同学帮忙。

如果原来是异步模式,说明备可用区是有数据落后于主可用区的,现在主可用区不可用了那么rpo不为0,只能有损恢复。

2.如果想把集群设置成普通3副本模式,需要去掉DR Auto-sync 的设置并且调整pd的相关配置为普通3副本,而且大概率需要重启集群。

总之一句话,这种双可用区的高可用模式需要人工介入的运维过程太多了,虽然硬件设施少一点但是后期人力成本是非常大的。相比之下推荐三可用区部署、或者主从集群,或者双机房引入第三仲裁区的方案。

只有大概,没有细节

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。