添加tikv节点-引发pd leader节点发生重启导致pd切主

版本:tidb 4.0.4
操作:扩tikv节点
现象:pd leader所在的机器io打满,且pd leader发生重启,导致pd切主

pd 旧leader 的日志

pd 进程发生重启

pd leader节点监控

PS:这个现象已经出现两次了,如需其他日志信息请联系我。

PD 的节点有其他的服务需要刷盘吗?比如 prometheus 监控。

虽然pd节点跟其他服务混部,但是iotop观察了一段时间定位到就是pd进程在占用io

pd的内存报错跟这个帖子有点类似https://asktug.com/t/topic/37357,而且在4.0.5版本也看到有内存泄漏的修复,不确定是不是bug。

可以升级一下最新的 v4.0.14 版本,看一下解决这个问题。

:joy:现在是还不能确定这个是否是这个bug,可以通过查阅什么日志定位一下吗

看 PD 的 FATAL 的日志,应该是 TiKV 扩容之后,引起 PD panic ,是一个已知问题。建议升级到 v4.0.15 。
详见 issue :https://github.com/tikv/pd/issues/3868

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。