TiDB集群中一个节点挂掉了,现要重新加入集群有问题

现在集群中有一个节点挂掉了,将上面的服务tidb、tikv、pd使用scale-in --force强制下线后,节点重新启动,执行扩容指令,但是扩容后组件tikv和pd有问题:


扩容文件内容:
image

现在将有问题的两个服务scale-in --force强制下线后,重新扩容后,pd服务好了,但是tikv还是offline:


查看报错:以为是之前的残留,于是将tikv有关的目录都重命名:

image
image
使用tiup cluster start tidb-test -N ID重新启动,还是不行

没有生成新的tikv-20160目录了?

如果不需要 offline 的节点,可以考虑将该节点变成 tombstone。
curl -X POST http://xx.xx.xx.xx:2379/pd/api/v1/store/1/state?state=Up
然后将该节点清除掉

额,我现在是想把原来关机了的tikv节点重新加入集群,执行扩容脚本后,是Offline的状态。。。。

需要查看对应节点 的 tikv 日志,找到起不来的原因

大神,正在看日志:
这个是那个节点的日志:


这个是tiup的日志:

这个显示的端口冲突吧

嗯,我觉得也是,但是
1、我还想用原来这个端口,可以嘛?
2、清理得话具体要把那个节点得哪些内容清理掉呢?
3、我用mv移走指令操作可以吗?
4、移走后可以直接restart -N 是什么其他操作?

你原先的端口我不清楚是啥啊,你可以 尝试 先缩容试试

我原先就是默认的20160端口

缩容过两次了,然后扩容,就是这个offline问题。。。。

1、缩容后,可以查看一下 pd-ctl store 命令 看是否还有该节点,因为缩容后的节点还一个状态是 tombstone,至于 删除 tombstone 状态的节点的命令,可以直接在 asktug 搜就ok

ok,我来试试

:ok_hand:

我缩容后也使用了prune指令还是这个,


store看了一下,还存在,状态时Offline,这个是要将状态变为tombstone嘛?

offline 需要等待它变成 tombstone 状态才行,offeline 代表正在迁移上面的 region

好吧,那我等着吧,应该春节后在交流了:joy:,这个迁移好了之后就可以直接扩容了嘛?

可以直接扩容

好吧,那我等着吧,等他offline好了,然后再扩容,额,扩容的时候需要把原来145节点上与tikv有关的目录都删掉嘛?可以直接mv重命名一下嘛?

不需要 mv,offline 之后默认会删除相关文件的