系统做了三权分立之后,tidb集群无法启动,已重新配置互信

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】6.5.0
【复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】

报错描述
Error: failed to start pd: failed to start: 10.0.55.26 pd-2379.service, please check the instance’s log(/tidb-deploy/pd-2379/log) for more detail.: executor.ssh.execute_failed: Failed to execute command over SSH for ‘tidb@10.0.55.26:22’ {ssh_stderr: , ssh_stdout: , ssh_command: export LANG=C; PATH=$PATH:/bin:/sbin:/usr/bin:/usr/sbin /usr/bin/sudo -H bash -c “systemctl daemon-reload && systemctl start pd-2379.service”}, cause: ssh: handshake failed: write tcp 10.0.55.23:39562->10.0.55.26:22: write: permission denied


1 个赞

10.0.55.26上的/tidb-deploy/pd-2379/log发一下看看

failed to start: 10.0.55.26 pd-2379.service, please check the instance’s log(/tidb-deploy/pd-2379/log) for more detail

2 个赞

你用tidb帐号登陆下55.25服务器 sudo有权限吗?

1 个赞

操作系统现在root用户没有su、sudo命令,本来是正常运行的,配置了三权分立,无法启动,求~

1 个赞

没有sudo 命令,
-bash: sudo:未找到命令

1 个赞


这个

没有error级别的错误信息么?

1 个赞

你们做了什么操作吧sudo删除了?
yum install sudo

tidb没有权限啊,你再服务器上把tidb的sudo权限加好

已关闭三权分立,恢复了sudo,一样的报错

sudo加好了,一样的报错

可以按照顺序先把其他节点先起起来,然后tikv节点一个一个起,把这台有问题的先不起(保证集群先运行),有条件的话这台先下线并搞台新机器先扩容进来,然后重新把有问题的机器环境啥的重新弄下

那估计可能还是权限的问题 :thinking:

1 个赞

感谢大佬,我再研究下

感谢大佬

先在目标机器上,tidb用户下执行sudo在/root目录建个文件啥的,测试一下

图片
似乎没有问题

参考这个看看,不知道有没有帮助?

1 个赞