扩容节点报错

我在测试扩容TIKV节点时,遇到报错,一共扩容了两个节点,一个成功了,一个没成功,是什么原因呢?
image



下面是日志的报错

103这个节点之前是在其他集群吗?
是不是没有完全卸载?有残留数据

是的,之前也有做个其他集群的扩容TIKV节点

  1. 如果已经从其他集群缩容掉了,那就把相关的目录都清理干净

  2. 如果其他集群还没有缩容这个节点,那就先正常缩容(前提是确定这个节点在老的集群不需要了),再加入新集群

我把TIKV对应的 deploy_dir、data_dir、log_dir 都清理掉了。但是我无法将集群的这个tikv节点缩容掉。尝试直接扩容这个节点也还是失败的。

执行完scale-in之后,display看看是什么状态
tiup cluster display XXXX

状态好像没变化

  1. pd-ctl 查看下store的状态以及 id
  2. 然后 store delete XXX
  3. pd-ctl查看状态
  4. display状态

pd-ctl 查不到192.168.10.103这个连不上的节点的信息 :sob:

  1. 那就把tiup配置文件中的这个节点删除,然后display看一下,应该就没这个节点了
  2. display不显示这个节点后,把这个节点的tidb相关的目录都删干净,然后重新加入就可以了

配置文件目录:/home/tidb/.tiup/storage/cluster/clusters/XXXX/meta.yaml
XXXX是集群名

先做个备份再修改

成功了! 非常感谢!

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。