使用TiUP部署DM集群,一直出现报错,说是SSH问题

Do you want to continue? [y/N]: y

  • Generate SSH keys … Done
  • Download TiDB components
    • Download dm-master:v2.0.0-rc (linux/amd64) … Done
    • Download dm-worker:v2.0.0-rc (linux/amd64) … Done
    • Download prometheus:v4.0.3 (linux/amd64) … Done
    • Download grafana:v4.0.3 (linux/amd64) … Done
    • Download alertmanager:v0.17.0 (linux/amd64) … Done
  • Initialize target host environments
    • Prepare 192.168.9.43:20022 … Error
    • Prepare 192.168.9.44:20022 … Error

Error: Failed to initialize TiDB environment on remote host ‘192.168.9.44’ (task.env_init.failed)
caused by: Failed to create ‘~/.ssh’ directory for user ‘tidb’
caused by: Failed to execute command over SSH for ‘tidb@192.168.9.44:20022’
caused by: Process exited with status 1

但是实际上节点之间ssh互信是没有任何的问题,并且文件系统是ext4,还可能是什么原因导致的

  • .ssh 目录权限 744authorized_keys 文件权限 600
  • 用户添加 sudo 权限
  • 确定免密配置好。使用密钥的,将中控机密钥 copy 到远程服务器

中控:192.168.9.43

topology.yaml文件:

global:
user: “tidb”
ssh_port: 20022
deploy_dir: “/data/dm/deploy”
data_dir: “/data/dm/data”

master_servers:

  • host: 192.168.9.44

worker_servers:

  • host: 192.168.9.43

monitoring_servers:

  • host: 192.168.9.44

grafana_servers:

  • host: 192.168.9.44

alertmanager_servers:

  • host: 192.168.9.44

ssh 互信测试:
[tidb@tk01-dbs-tidb-9-43 ~]$ ssh -p20022 tidb@192.168.9.43
Last login: Fri Oct 30 15:59:02 2020 from 192.168.9.43

[tidb@tk01-dbs-tidb-9-43 ~]$ ssh -p20022 tidb@192.168.9.44
Last login: Fri Oct 30 14:44:16 2020
[tidb@tk01-dbs-tidb-9-44 ~]$

ssh的权限:
ls -al .ssh/
total 16
-rw------- 1 tidb tidb 1615 Oct 30 15:52 authorized_keys
-rw------- 1 tidb tidb 1679 Oct 30 12:19 id_rsa
-rw-r–r-- 1 tidb tidb 405 Oct 30 12:19 id_rsa.pub
-rw-r–r-- 1 tidb tidb 1208 Oct 30 14:38 known_hosts

[tidb@tk01-dbs-tidb-9-44 ~]$ ls -ld .ssh/
drwxr–r-- 2 tidb tidb 80 Oct 30 14:32 .ssh/

没有看到有啥问题

执行的命令: tiup dm deploy dm-test ${version} ./topology.yaml --user tidb -i /home/tidb/.ssh/id_rsa

感谢你专业的反馈, 辛苦确认下登陆到远程服务器之后是否可以执行 sudo su - 命令,

非常感谢你的指导,按照您的指导:登陆到远程服务器之后执行 sudo su - 命令,需要输入密码
sudo配置需要配置成 tidb ALL=(ALL) NOPASSWD:ALL 之后就可以了

之前配置的是 tidb ALL=(ALL) ALL一直提示ssh的问题

:+1:, 有问题欢迎开新帖继续提问, 可以看下这个文章, 对 deploy 常见问题有总结

好的,感谢您的专业指导:handshake:

客气了, 你的问题已经添加进去, 感谢分享.

非常赞,解决了我的问题

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。