集群启动失败

【TiDB 使用环境】生产环境 /测试/ Poc
【TiDB 版本】
【操作系统】centos7.4
【部署方式】云上部署(移动云)
【集群数据量】
【集群节点数】7
【问题复现路径】做过哪些操作出现的问题
集群启动失败保持
【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【复制黏贴 ERROR 报错的日志】
【其他附件:截图/日志/监控】

看看这个帖子 (专栏 - 解决tiup‘ssh: unable to authenticate’报错 | TiDB 社区)

ssh免密不通?自己测试下看看

像是ssh认证失败了。先ssh验证下,各台之间免密互通正常吧!

话说这么念旧吗?用centos7,好歹也用个7.9的终结版哈。 :joy:

没做互信,安装应该也会报错吧,到start的阶段了?

ssh校验失败的坑有点多 建议多写点操作步骤进行详细分析
比如部署方式 操作等

不是,安装有-i -p两种模式

还有一种可能,就是部署用的互信用户,启动用的没有互信用户。

3、如果机器互信正常,进一步检查tiup目录下的id_rsa跟家目录下的id_rsa是否相同,若不相同,则需要把家目录下的id_rsa拷贝到tiup目录下;tiup的id_rsa路径为:/home/tidb/.tiup/storage/cluster/clusters/tidb-test/ssh/id_rsa
/home/tidb目录中我没发现这个隐藏文件 只有.ssh

首次部署的话 不存在服务器的ssh 和tiup 不一样这个问题,基本都是扩容导致的

你是用的root用户 这个是tidb用户下的.ssh

各位老师,集群之前就是部署(root用户)完的,也 正常使用,之后服务器安装过令牌并升级过openssh,,目前openssh10版本。 我按照已经做ssh免密登录了,成功的。但是下面这块3、如果机器互信正常,进一步检查tiup目录下的id_rsa跟家目录下的id_rsa是否相同,若不相同,则需要把家目录下的id_rsa拷贝到tiup目录下;tiup的id_rsa路径为:/home/tidb/.tiup/storage/cluster/clusters/tidb-test/ssh/id_rsa
没有.tiup这个隐藏文件夹 只有.ssh 请老师帮分析 看一下 我该怎么做

因为厂商迁移服务器 ip有冲突 想重启后 发现问题了

openssh 10 我知道啥问题了。tiup 默认使用id_rsa 密钥,但是ssh9 高版本已经移除该方式了
你可以强制使用系统的ssh 密钥

这个ssh互信配置,指的是tiup中控机跟每台tidb组件服务器的ssh互信是吗?如果是的话,你在中控制直接使用ssh pd节点的ip 试试,能不能ssh进到pd组件的机器上

老师请问具体该如此操作

老师 我现在tiup本机上就有一个pd,这个就起不来。。。。。

启动命令 加上–ssh=system参数试试

要是还是报错
在用户的.ssh下 创建config 文件,然后看看.ssh 下用的什么密钥 比如我这个

放入如下内容
Host *
IdentityFile ~/.ssh/id_ed25519

参考专栏看看。