直接写入tikv时,有一个节点leader降到0,频繁报:peer is not leader for region xxxx, leader may None

但只有62的leader降到了0

这个是符合预期的,因为如果2个tikv的leader都evict,那某些raft组的多数派就没办法维持了。所以2个都高的情况下只能evict一个。

这么看的话leader掉0的主要原因,就是evict slow store。如果确定你的盘很慢,我感觉可以考虑去掉evict slow store 这个scheduler。

你可以看看这个帖子,里面对于slow store的讨论是比较全面的。从判断机制,到解决方法。

以往掉0,我会第一时间感觉是slow store的问题。这次我没有第一时间怀疑是slow store,主要是以往碰到的都是瞬间掉下去,很快又回来。你这个leader掉0持续10几分钟的,比较少见。你后面不提一句盘性能不行,我真没往这个方向上想过。 :sweat_smile:

1 个赞