重启集群中的一个节点-重启节点报错,偶尔起不来,偶尔能起来

image

重新配吧,没配对 :joy:

按照官网一步一步走的。。。

看下系统是不是有什么报错呢

也没报错,就是配置上之后,不起效果

tiup -N启动单个节点,然后去看下组件的日志,有没有什么报错

感觉不少人都在互信这块出现过问题。

之前也没什么问题,后来因为ssh漏洞进行过ssh服务升级,以及一系列的安全加固

需要检查下互信 以及使用账号的权限问题。

这么说的话那应该是你ssh 配置导致某些节点无法远程登录了吧,检查下是不是ssh配置本身的问题

文件夹权限问题

文件夹权限问题是啥,是不是集群初始化前手动修改了文件夹的权限

文件夹得是755不知为什么被改成777了权限太大,导致免密登录失败

root账户以及可以免密登录了,但是还是一样,问题没有解决

em…这机器是不是环境不干净,之前装过tidb,你这是重装?

不是的,只不过后期扩容扩着扩着就出现问题了

集群间的互信靠的不是操作系统的本身的互信,而是 .tiup 文件夹下面 tiup 自己维护的互信,你要修也是修这个

现在手动scp不需要密码了,手动scp的话出现这个错误
/etc/bashrc: line 84: /dev/null: Permission denied

真神奇,改一下用户权限,再改回来,重复操作,重复互信,就好使了,感觉啥也没做