TiKV宕机后重启,注册pd失败


pd-ctl下不了。

这不是显示成功了吗

只是显示是成功的,查询store,这个store=4的还是offline,这是我刚查的,还在这,offline


image

之前的 TiKV --data-dir 指定的路径下没有数据文件夹(删除或移动后没有更新 --data-dir)

5.0.3版本,我们看到当时这个节点storage readpool cpu特别高,tikv第一次宕机应该是这个原因,但是为啥这个cpu会很高呢,使用的tispark读取,且tikv region leader分布是均匀的(当时都是6K,界面显示9k是后来27宕机后,其他节点还有写入)
image
image

重启时日志得看

老师,您帮忙看下这个,很急,还是这个集群,又挂了,现在挂的这个节点里有很多leader region,该如何操作

我们现在知道是因为写入并发大,负载高的原因了,准备升配,但是现在这个节点怎么正确恢复

发这个帖子时我们觉得是3副本,挂掉一个没有问题,直接–force了,但是pd中残留了脏数据
现在我们不强制下线了,region都还在,但是store是disconnected,tikv无限OOM重启,该怎么正确恢复

这个命令没有,曾经一个集群的region是 坏掉很多,但是执行这个命令 输出都是healthy,让人怀疑人生。

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。