在数据恢复时发现掉 leader 的情况,请教是什么情况引起的?
使用什么工具做的恢复?
掉leader应该Store leader score也是下降的,看看对应节点的资源利用率,磁盘、网络等状况。
用的 br,能让 slow store 的评分不生效吗
这个没了解过。
等恢复完成后过一会leader 应该就会均匀了。 checksum阶段tikv cop task没有出现异常积压应该就还好。
写偏斜应该还好吧,可以看看region count,一般是均衡的。
每次恢复都是这个节点出现drop leader吗?
region 没问题,就是因为 slow store 掉 leader
如果对恢复速度没有太大的要求的话,可以考虑降低恢复的速度看看