TiFlash 同步卡住

在之前引用的 https://docs.pingcap.com/zh/tidb/stable/troubleshoot-tiflash#tiflash-数据同步卡住 中有明确指出,down peer 没有清理干净可能会导致同步卡住”

建议先查下为什么 down-peer 有时持续上涨,有时不稳定存在。看是什么原因,3 副本缺一个会自动补,3副本缺 2 不满足多数派估计会有问题。

请问一下有什么比较好的方法排查 down-peer 吗,down-peer 一般是什么原因导致的呢?

我通过命令 select * from TIKV_REGION_PEERS where STATUS = 'DOWN' 发现 90% 的 down-peer 都集中在某个 store 上面

  1. 有可能是因为磁盘降速 Raft 驱动不下去,也可能是网络导致短暂隔离,或者是 PD 到 TIKV 之间心跳出现了问题;
  2. 排查方法要看日志指向了哪个方向,建议看看这个 store 的 tikv 日志;