tidb集群扩容tiup cluster reload tidb-pro部分节点异常

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】5.4.0
【复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
【资源配置】
【附件:截图/日志/监控】
Error: init config failed: hdp010:2379: transfer from /root/.tiup/storage/cluster/clusters/tidb-pro/config-cache/pd-hdp010-2379.service to /tmp/pd_d50874cb-551b-46d6-85b5-80481e0f25ac.service failed: failed to scp /root/.tiup/storage/cluster/clusters/tidb-pro/config-cache/pd-hdp010-2379.service to tidb@hdp010:/tmp/pd_d50874cb-551b-46d6-85b5-80481e0f25ac.service: ssh: handshake failed: ssh: unable to authenticate, attempted methods [none publickey], no supported methods remain

root用户与tidb用户之间都做了免密互信且都有sudo权限,scp 这个命令也可以手动执行,只是需要加-P9922 指定端口号,服务器端口号不是默认的22端口,不知道跟这个有没有关系?且异常的是既有的节点上的角色,新增的节点及角色正常。

扩容不是scale out就行吗?为啥要reload,新部署的节点上ssh端口也是9922吗?还是只有原来部署的节点是9922?

如果新扩容的服务器端口跟原来的不一样,要在host下面指定ssh_port

global配置下有没有指定ssh_port,另外把tiup和tiup cluster 升级到最新。

看下这里是不是默认的22端口,是的话修改一下

所有的节点端口都是9922,scale-out最后一步分发配置文件的时候老节点的角色配置分发失败,新节点的是成功的

global配置的是9922

具体的报错信息,以及你的操作描述一下

操作就是执行扩容tiup cluster scale-out tidb-pro /data02/soft/tidb/tidbandtikv-scale-out.yaml,安装都成功了,分发配置的时候老节点不成功

Error: init config failed: gwmidc010:2379: transfer from /root/.tiup/storage/cluster/clusters/tidb-pro/config-cache/pd-gwmidc010-2379.service to /tmp/pd_ae4ac8d1-b7f2-4ded-9697-020f048b0e3a.service failed:
failed to scp /root/.tiup/storage/cluster/clusters/tidb-pro/cg-cache/pd-gwmidc010-2379.service: ssh: handshake failed: ssh: unable to authenticate,
attempted methods [none publickey], no supported methods remain

都是9922

报错信息看起来还是ssh的问题,确认一下对应的key这些是否都已经传输过去,排查方向还是ssh
[none publickey]

我再排查一下,谢谢

public key都有而且没有问题,root tidb用户ssh跳转都没问题,publicKey=/root/.tiup/storage/cluster/clusters/tidb-pro/ssh/id_rsa.pub 分发的时候是用tiup这个目录的publickey还是root用户下的publickey,发现tiup目录下的key不是用户目录下publickey

scale-out 指定用户了吗,我一般这样扩容

tiup cluster scale-out tidb-cname scale-out2023031601.yaml --user root -p

没有指定root,不指定的话应该是默认当前用,-p是要输入密码么?

我这没有做免密,所以用的密码

各台机器重新配置一下ssh互信,然后提前相互登陆一遍,密钥的权限也要设置正确