故障节点强制下线了,怎么快速补充副本?现在补充的速度太慢了

【TiDB 使用环境】生产环境 /测试/ Poc
【TiDB 版本】4.0.8
【操作系统】
【部署方式】云上部署(什么云)/机器部署(什么机器配置、什么硬盘)
【集群数据量】
【集群节点数】
【问题复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【复制黏贴 ERROR 报错的日志】
【其他附件:截图/日志/监控】

调高了 store limit
调大了 region-schedule-limit replica-schedule-limit
调大了 max-snapshot-count
但是 replace-rule-down-peer 的产生速度没有任何变化,大概就是几秒钟一个。能不能快点?现在有17k的region缺一个副本,如果补的时间太长,再故障一个节点,很集群节点不可用了。

问题已解决:
仔细看了看pd的监控,发现 operator 生成的速度就是15,突然想到是不是原来 store 的 store limit 限制的。

我原来的 store 已经强制下线,store limit 看不到。

通过强行执行 store limit 1 1000 remove-peer 后,速度一下就上来了。

1 个赞

此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。