节点下线后,处于Pending Offline无法消失,等了1天

【 TiDB 使用环境】生产
【 TiDB 版本】6.1.0
【遇到的问题:问题现象及影响】节点除了问题,下线后,处于Pending Offline 查看过相关信息,已经没有size了,但是region_count还有3499,这个Pending Offline就是不消失,请问怎么才能消失

region迁移慢,只要一直再减少就没问题

这个3499卡了很久很久了

看文章 先手工调度

可以打开grafana站点,看一下pending offline的进度,有可能数据太大,还没进行完成。我经历过pending一天的情况。有参数可以调整加速。

没leader了是不是也可以大胆一点直—force直接下线

@h5n1 @tidb菜鸟一只 是的,但是生产不敢这么搞,就是3499个region_count卡在那,也无法手动调度,都是空的

看下这篇文章:专栏 - tikv下线Pending Offline卡住排查思路 | TiDB 社区

region迁移 Leader迁移是两码事,leader为0了,还要等region_count为0 ,现在要做的是手动触发region迁移的动作,还需要再看前面的文档,–force只是从tiup里删除了节点,真正的集群里不会真正删除,不要轻易用

有遇到过 PD 集群的状态异常,可能会导致节点无法正常下线

image
所有的都是0了,但是状态还是Pending Offline
而且尝试看这两个KV-SERVER进程,一直在无限重启,down,重启,down
日志还不停的输出报错,请帮忙看看,感谢感谢


你试过h5n1大佬这里提到的办法了吗,核对试试看

专栏 - TiKV缩容下线异常处理的三板斧 | TiDB 社区.

你这个tikv重启好像是有个单独帖子吧,这两个可以停了,用6.1 的online unsafe recover

谢谢大佬,online unsafe recover好用

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。