集群无法正常停止

1、执行: tiup cluster stop tidb-test 报如下错误:


2、执行: tiup cluster display tidb-test 显示正常
从上面报错信息看,说是密钥的问题,没有权限去ssh。请问具体怎么操作?
部署的时候:
tiup cluster deploy tidb-test v7.5.0 ./topology.yaml --user root
各个机器之间好像没有免密,之前是正常的stop,今天发现不行了。

网络都通吧

你们机器是不是有管控,把你的公钥给刷没了,如果是这样的话,就拷贝一份公钥过去,或者你正常输用户密码也行,而且之前的用户是root,还是tidb

能具体说明一下吧,之前的是root

你的yaml里面配置的用户还是tidb用户吧,你通过tidb用户看下能不能免密登录,不行的话重新配置下互信https://docs.pingcap.com/zh/tidb/v6.5/check-before-deployment/#手动配置-ssh-互信及-sudo-免密码

user: tidb
tiup cluster edit-config tidb-test 这里面用户是tidb
1、我这集群平时管理是root用户管理的,当时部署的时候也应该是root用户部署的(当时不是我部署的)
2、免密钥,是针对root来免密,还是tidb用户?

21的日志里有什么有用信息么?

没有有用的信息,日志正常,这错误主要是免密钥引起的,这密钥弄得头疼,不知道怎么具体去弄。


提示没有权限执行,我单独执行后,是有权限的。

按这个链接搞就行。

注意这个地方

操作反了,是用本地tidb用户 连 目标IP的root 用户,不需要输入密码直接登录才是有权限。

image
是这样吗?

对,这是本地的。 执行exit退出,然后再试试远程的。 ssh ip

如果都没问题,在中控机上用tidb登录,然后用tidb用户执行display命令,看看能不能成功,如果能成功,在执行stop命令

我在中控机器上,之前都是root用户去执行display的。没有用过tidb去执行

正常来说应该是用tidb用户来安装部署的。应该是你的步骤哪里有不对的,然后你又是使用root来安装的。你是用tidb用户试试,如果是tiup安装 他是会自动给tidb所有节点部署免密的。

用tidb试试,因为配置文件的是tidb

你中控机上有tidb用户吗,用这个用户试下,另外你的中控机上有没有再部署tidb的组件

/usr/bin/sudo -H bash -c “/root/.tiup/components/cluster/v1.13.1/tiup-cluster display tidb-test”
用户tidb用户,由于环境变量的原因,需得上面的语句执行,跟传统的tiup cluster display tidb-test 命令不太一样了。

中控机上有tidb用户,上面也部署了组件,tidb,pd组件。

:joy:看来之前部署的人是两个用户都搞了,然后又没有交接好,导致现在的问题~

1 个赞