tidb集群使用的时候重启提示ssh命令无法执行

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】v7.5.1

【遇到的问题:问题现象及影响】
相当奇怪的问题最开始使用tiup部署集群的时候都是文档中默认的配置,用户一般也都是tidb
但是并不知道密码,之前的时候执行这个 tiup cluster restart tidb-cluster 这个命令没有问题
我的tiup装在70上,然后今天再次执行这个命令的时候出现这个错误,大概意思应该就是ssh连接不上,或者连接上了也米办法执行相应的命令,之前部署的时候也遇到这个问题 我是直接把公钥放在别的服务器里面root用户里面就可以解决,但是在70也就是tiup所在的机器上莫名其妙的只连接tidb这个用户,刚开始我以为ssh连接不上,但是又不知道密码于是特意改了密码ssh连接上了但是命令没办法执行 在别的两台机器上就没有问题

【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】

确保TiUP配置中指定的SSH用户在目标机器上存在,并且具有执行TiDB相关命令的权限。确认TiUP或你个人的SSH客户端是否配置了正确的私钥来访问目标机器。

大佬们现在其实是 我用的user用户 tiup也在user用户下,之前直接执行命令就可以重新启动就最近才不让用的,我觉得这些命令应该root可以使用但是怎么配置让执行的时候使用root 用户而不是tidb用户这个让我很难搞,当时部署集群的时候,别的机器可以设置连接root用户,但是这个是本机一台机器所以当时没设置一致用的user

tidb用户的sudo免密还在么?

看下别的设备是不是设置了sudo用户免密,/etc/sudoers,这台没设置

目标机器看看 systemd 的日志,一般里面会记录失败详细原因


都没设置无论是别的机器还是这个机器

这个,我部署完成就没设置过这个,因为这个用户是部署的时候自动创建的,不知道密码 :sob: 所以自然就没有设置这些

把tidb用户加入root组呢?

看图片,集群是tidb用户部署的,你是user用户登录的,tidb用户执行的ssh tidb@186.18.70.22有问题。你是不知道tidb用户密码还是root的,我都没看懂 :sweat_smile:
可以排查下:
1在tiup所在主机tidb登录 ssh tidb@186.18.70.22是否需要密码,需要那就没配置ssh互信
2继续手工stop这个grafna-3000.service(登录到22用tidb),有问题那就是这个grafna服务有问题。
tidb用户
sudo -root systemctl restart grafana-3000.service
tail -f /var/log/messages
我这边看着没问题


3你要是tidb没root免密那就是root执行的

刚刚加进去去了,但是还是这个问题


这就是奇怪的地方 ssh可以直接进去

然后日志这个也是能正常启动的
然后tidb用户刚给他了sudo 免密

但是结果还是不行 :sob:


但是这个里面似乎确实没问题 :sob:

你手工ssh tidb@地址看下呢

tiup cluster check tidb_cluster --cluster
检查下集群

All regions are healthy.
都正常吗


这下面坏了不少 :sob: :sob: