pd扩容后加入集群失败

【 TiDB 使用环境】测试
【 TiDB 版本】7.3.0
【复现路径】原来有两个pd节点,正常编写pd扩容文件,扩容后启动失败
【遇到的问题:问题现象及影响】
扩容文件
image
报错信息

还有个现象不知道跟这个问题有没有关系,就是访问原pd端口的dashboard时,提示Dashboard is not started. 命令行查看时提示如下:


我本想把pd迁移到一台配置高点的机器上,但是第一步扩容就失败了。有没有大神遇到过,帮忙指导一下,感激不尽
【资源配置】

1 个赞

这个目录存在吗

不存在,这个应该是自动创建的吧

扩容的时候tiup没有报错信息吗

其他都正常,就是启动的时候等待超时了

你看一下目录权限是否对,大概率是权限问题

目录权限,还有ssh,还有提示的目录,创建一下

看了下目录权限没有问题,跟其他的节点一样

手动添加member目录,并赋700权限后,还是报错。只是日志里少了提示目录不存在一行

手动通过systemctl启动是否可以启动成功?

pd集群的状态现在是正常的吗?看一下其它pd节点的日志,看看是否有新加入节点的连接记录

事先存在目录了,但又没有这个目录的权限

一样的错误

tiup查看状态是正常的,但是我看了下日志,pd一直在试图连接一台已被缩容掉的pd节点

权限出现问题,直接改成777,你改成700,怎么就能保证肯定不是权限问题了呢,如果777还有问题,那就肯定不是权限 问题了

你是本来3台PD,然后缩容掉1个PD,现在有扩容1个PD,是这样吗??缩容的那个必须缩容成功,完全剔除掉,扩容才没问题,你这个感觉像是之前那个PD是损坏的,没有缩容掉,或者没有缩容成功,缩容成功日志不可能会提示去连接这个服务器的。
缩容没成功,扩容是有问题的

原来没有目录,都是自动创建的

之前缩容过一个pd,当时应该是成功的,拓扑文件里已经看不到了。看日志似乎pd集群认为它还存在。这个有没有办法更新下pd的状态

对,同问,你缩容后pd状态如何?滚动重启pd了吗

你要看呀集群信息呀。还有监控里面有没有对应的信息,你又没有刷新状态:


https://docs.pingcap.com/zh/tidb/v7.1/scale-tidb-using-tiup#缩容-tidbpdtikv-节点