tidb7.5.1扩容tikv节点无法启动

按照官方给的文档,扩容tikv节点失败。
配置扩容文件:
cat </home/tidb/scale-out.yml
tikv_servers:

  • host: 192.168.2.22
    ssh_port: 22
    port: 20160
    status_port: 20180
    deploy_dir: /data1/tidb-deploy/tikv-20160
    data_dir: /data1/tidb-data/tikv-20160
    log_dir: /data1/tidb-deploy/tikv-20160/log
    EOF
    检查
    tiup cluster check tidb-cluster /home/tidb/scale-out.yml --cluster --user root -p -i /root/.ssh/id_rsa
    修复
    tiup cluster check tidb-cluster /home/tidb/scale-out.yml --cluster --apply --user root -p -i /root/.ssh/id_rsa
    扩容
    tiup cluster scale-out tidb-cluster /home/tidb/scale-out.yml --user root -p -i /root/.ssh/id_rsa
    之后启动集群,查看拓扑状态,其中新增的tikv04节点状态为down,请各位老师帮忙看看如何定位。
    tiup cluster display tidb-cluster
    Checking updates for component cluster… Timedout (after 2s)
    Cluster type: tidb
    Cluster name: tidb-cluster
    Cluster version: v7.5.1
    Deploy user: tidb
    SSH type: builtin
    Dashboard URL: http://192.168.2.15:2379/dashboard
    Grafana URL: http://192.168.2.20:3000
    ID Role Host Ports OS/Arch Status Data Dir Deploy Dir

192.168.2.20:9093 alertmanager 192.168.2.20 9093/9094 linux/x86_64 Up /data1/tidb-data/alertmanager-9093 /data1/tidb-deploy/alertmanager-9093
192.168.2.20:3000 grafana 192.168.2.20 3000 linux/x86_64 Up - /data1/tidb-deploy/grafana-3000
192.168.2.14:2379 pd 192.168.2.14 2379/2380 linux/x86_64 Up|L /data1/tidb-data/pd-2379 /data1/tidb-deploy/pd-2379
192.168.2.15:2379 pd 192.168.2.15 2379/2380 linux/x86_64 Up|UI /data1/tidb-data/pd-2379 /data1/tidb-deploy/pd-2379
192.168.2.16:2379 pd 192.168.2.16 2379/2380 linux/x86_64 Up /data1/tidb-data/pd-2379 /data1/tidb-deploy/pd-2379
192.168.2.20:9090 prometheus 192.168.2.20 9090/12020 linux/x86_64 Up /data1/tidb-data/prometheus-9090 /data1/tidb-deploy/prometheus-9090
192.168.2.17:4000 tidb 192.168.2.17 4000/10080 linux/x86_64 Up - /data1/tidb-deploy/tidb-4000
192.168.2.18:4000 tidb 192.168.2.18 4000/10080 linux/x86_64 Up - /data1/tidb-deploy/tidb-4000
192.168.2.19:4000 tidb 192.168.2.19 4000/10080 linux/x86_64 Up - /data1/tidb-deploy/tidb-4000
192.168.2.21:9000 tiflash 192.168.2.21 9000/8123/3930/20170/20292/8234 linux/x86_64 Up /data1/tidb-data/tiflash-9000 /data1/tidb-deploy/tiflash-9000
192.168.2.11:20160 tikv 192.168.2.11 20160/20180 linux/x86_64 Up /data1/tidb-data/tikv-20160 /data1/tidb-deploy/tikv-20160
192.168.2.12:20160 tikv 192.168.2.12 20160/20180 linux/x86_64 Up /data1/tidb-data/tikv-20160 /data1/tidb-deploy/tikv-20160
192.168.2.13:20160 tikv 192.168.2.13 20160/20180 linux/x86_64 Up /data1/tidb-data/tikv-20160 /data1/tidb-deploy/tikv-20160
192.168.2.22:20160 tikv 192.168.2.22 20160/20180 linux/x86_64 Down /data1/tidb-data/tikv-20160 /data1/tidb-deploy/tikv-20160

看看扩容节点的日志,节点没配信任?

检查下防火墙

先看网络,手动ssh 是否可以

/data1/tidb-deploy/tikv-20160/log 这里面是啥

配置了互信没

可以试试看在中控机能否ssh上去新增的tikv机器

我看这是内网地址,要么是防护墙做了限制,要么是ssh没有配好,建议都排查下

check 及 apply 运行之后,后告警或者报错吗

新KV节点日志报什么错?

错误日志,check结果 都没 盲猜呀 :sweat_smile:

扩容节点的日志呢?

:joy:老哥方便给点别的信息嘛

按理说不应该呀,把日志贴全点儿

看看日志

重启了主机后就好了。谢谢大家的回复。

是不是以前这个机器上装过tikv端口占用了

日志。

资源太紧张了,之前重启偶尔也遇到过。

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。