这个问题,请查看下下面的内容:
1、确认下 sync-log 参数的设置,一般情况下生产环境应为 true,以确保不会因服务器异常掉电而带来数据、log 没有及时落盘进而出现上述报错
2、请确认下是否当前只有一个 TiKV 节点出现这个问题,如果是可根据情况评估修复方式:
(1)方式 1:将故障 TiKV 节点缩容(变成 tombstome 后),再扩容到集群环境中。该操作方式与普通的扩缩容操作一致,但是需要考虑到扩容 balance 给集群带来的影响,酌情调整 scheduler-limt 以及 store-limit 相关参数。
(2)方式 2:找到受影响的 Region,并依次设置其为 tombstone,尝试启动故障节点。整体操作较为复杂:
1) 打印 Raft 状态机出错的 Region
https://docs.pingcap.com/zh/tidb/v4.0/tikv-control#打印-raft-状态机出错的-region
2) 设置一个 Region 副本为 tombstone 状态
https://docs.pingcap.com/zh/tidb/v4.0/tikv-control#设置一个-region-副本为-tombstone-状态
论坛中类似报错的帖子可供参考,如下: