如何避免线上用户感知到数据库层面的问题,因为TiKV机器挂掉,导致Region is unavailable的问题。

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】:v4.0
  • 【问题描述】: 配置:8TiKV,双实例配置,3PD,2TiDB。 疑问:其中一台机器挂掉了,导致了其中两个TiKV进程退出,从而导致报错,Region is unavailable,现在如果配置或是设置能够从数据库层面避免这样的问题?

若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

请检查是否配置了lable,如果没有,3副本情况下,有2副本已经不可用了。

在已有的配置上再加lable的话,操作步骤应该是什么样的?

可以参考这两个 SOP

对于您解释的,3副本情况下,2副本以及不可用了,剩下一个副本也不可用使用了吗?

是的,raft 协议是需要满足半数以上副本,对于3副本来说就需要2个,只剩下一个是选不出leader的。

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。