allens
(Allens)
1
【 TiDB 使用环境】生产环境
【 TiDB 版本】7.5.0
【复现路径】通过tiup 扩容节点,执行扩容前检查
tiup cluster check tidb-c1 ./scalout.yaml --cluster --user dba -p -i /home/dba/.ssh/id_rsa
【遇到的问题:问题现象及影响】
执行tiup cluster check的时候报错:
Error: stderr: : executor.ssh.execute_failed: Failed to execute command over SSH for 'dba@10.1.4.44:22' {ssh_stderr: , ssh_stdout: , ssh_command: export LANG=C; PATH=$PATH:/bin:/sbin:/usr/bin:/usr/sbin; /usr/bin/sudo -H bash -c "tar --no-same-owner -zxf /tmp/tiup/bin/insight-v0.4.2-linux-amd64.tar.gz -C /tmp/tiup/bin && rm /tmp/tiup/bin/insight-v0.4.2-linux-amd64.tar.gz"}, cause: ssh: handshake failed: read tcp 10.1.4.30:12180->10.1.5.44:22: read: connection reset by peer
看了多个相关问题帖子,都是关于调整参数,如:TiUP FAQ,TIKV多磁盘ssh connection reset by peer
我已将所有节点/etc/ssh/sshd_config中参数调整为:
MaxSessions 10000
MaxStartups 10000
但一样报错
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】
tiup-cluster-debug-2024-06-20-18-00-44.log (39.3 KB)
我也遇到这种情况了,目前中控机和目标服务器之间可以免密登录
服务器是不是重启过呢? 所以visudo那个配置失效了吧【tidb ALL=(ALL) NOPASSWD: ALL】
diwing
(Ti D Ber R Qstj35v)
5
服务端负载高不,防火墙安全组放行没。手动执行ssh -vvv root@host 详细调试试试看
Kongdom
(Kongdom)
6
目标节点是一台新服务器,没有什么其他自己的服务,目前负载不高 执行ssh -vvv试过,没发现什么报错信息,手工直接执行ssh可以正常登陆并执行相关的命令
服务器没有重启过,visudo 那个配置配的是tidb,这里报的是root用户的呢》?
中控机和目标机的防火墙都是关闭状态,这里的57566端口不是唯一的,执行一次check,这个端口都会变
Kongdom
(Kongdom)
10
关键是免密登录么?要不要输入密码? 中控机到集群各个服务器都要免密登录,包括本机。
在中控机中我使用的是-p 命令输入的目标机密码登录的,中控机hcicloud用户和目标机root用户之间也需要做免密么?
tiup-cluster-debug-2024-12-24-09-11-39.log (96.4 KB)
Kongdom
(Kongdom)
12
做免密了,就不需要 – user -p了,去掉之后再试试。
去掉-p使用免密登录,也还是报这个错误,这个是ssh的问题么?
tiup-cluster-debug-2024-12-24-09-32-43.log (97.9 KB)
Kongdom
(Kongdom)
14
目前整体上的情况是,1、中控机我使用的是hcicloud用户扩容,目标机指定使用root用户进行操作,已经配置了中控机与目标机之前的免密,手工在中控机执行ssh root@192.168.1.160可以正常登陆,执行 sysctl -a,但是在执行tiup cluster check命令的时候,提示tcp报错; 2、在中控机和目标机的sshd_config文件中修改了maxsessions 1000,maxstartup 1000,重启了sshd服务, service restart sshd 但是还是报这个错误; 3、尝试测试了通过中控机扩容到其他的服务器 192.168.1.55,整个流程都正常,并且扩容成功; 4、接下来还是需要按照ssh的排查方向来进行吗?有没有其他的场景导致这种问题?我使用的是联通云服务器,每台服务器上的防火墙都关闭了,还有其他的可能性么?
Kongdom
(Kongdom)
17
我记得云服务器的防火墙在 控制台 应该也有设置的,不止服务器里面。
我有一个点不是太明白,中控机使用ssh 可以正常登陆,但是tiup就会报异常,这种情况,是不是可以排除防火墙的配置问题
Kongdom
(Kongdom)
19
哦,对,这么看你说的是对的。看看其他人还有没有办法吧。