【自己重新安装操作系统后解决】Error: failed to start tidb: failed to start:

【 TiDB 使用环境】\测试环境\
【 TiDB 版本】5.4.1
【遇到的问题】
【复现路径】做过哪些操作出现的问题
【问题现象及影响】
[tidb@T1018666 ~]$ tiup cluster display tidb-test
tiup is checking updates for component cluster …
Starting component cluster: /home/tidb/.tiup/components/cluster/v1.10.2/tiup-cluster display tidb-test
Cluster type: tidb
Cluster name: tidb-test
Cluster version: v5.4.1
Deploy user: tidb
SSH type: builtin
Grafana URL: http://10.22.231.124:3000
ID Role Host Ports OS/Arch Status Data Dir Deploy Dir


10.22.231.124:9093 alertmanager 10.22.231.124 9093/9094 linux/x86_64 Down /tidb-data/alertmanager-9093 /tidb-deploy/alertmanager-9093
10.22.231.124:3000 grafana 10.22.231.124 3000 linux/x86_64 Down - /tidb-deploy/grafana-3000
10.22.231.226:2379 pd 10.22.231.226 2379/2380 linux/x86_64 Down /tidb-data/pd-2379 /tidb-deploy/pd-2379
10.22.231.227:2379 pd 10.22.231.227 2379/2380 linux/x86_64 Down /tidb-data/pd-2379 /tidb-deploy/pd-2379
10.22.231.228:2379 pd 10.22.231.228 2379/2380 linux/x86_64 Down /tidb-data/pd-2379 /tidb-deploy/pd-2379
10.22.231.124:9090 prometheus 10.22.231.124 9090/12020 linux/x86_64 Down /tidb-data/prometheus-9090 /tidb-deploy/prometheus-9090
10.22.231.229:4000 tidb 10.22.231.229 4000/10080 linux/x86_64 Down - /tidb-deploy/tidb-4000
10.22.231.230:4001 tidb 10.22.231.230 4001/10081 linux/x86_64 Down - /tidb-deploy/tidb-4001
10.22.231.231:4000 tidb 10.22.231.231 4000/10080 linux/x86_64 Down - /tidb-deploy/tidb-4000
10.22.231.124:9000 tiflash 10.22.231.124 9000/8123/3930/20170/20292/8234 linux/x86_64 N/A /data1/tidb-data/tiflash-9000 /data1/tidb-deploy/tiflash-9000
10.22.231.86:20160 tikv 10.22.231.86 20160/20180 linux/x86_64 N/A /data1/tidb-data/tikv-20160 /data1/tidb-deploy/tikv-20160
10.22.231.87:20161 tikv 10.22.231.87 20161/20181 linux/x86_64 N/A /data2/tidb-data/tikv-20161 /data2/tidb-deploy/tikv-20161
10.22.231.92:20160 tikv 10.22.231.92 20160/20180 linux/x86_64 N/A /data1/tidb-data/tikv-20160 /data1/tidb-deploy/tikv-20160

Error: failed to start tidb: failed to start: 10.22.231.231 tidb-4000.service, please check the instance’s log(/tidb-deploy/tidb-4000/log) for more detail.: timed out waiting for port 4000 to be started after 2m0s

救救孩子吧,Tidb就安装成功一次,升级后启动不了了,重新安装又失败了!

tiup-cluster-debug-2022-07-07-17-26-23.log (279.4 KB)

这是返回的bug日志信息

刚开始部署的时候,使用检测功能检查,都是正常的,部署也能走到最后,初始化的时候失败,好难啊

pod和tikv都可以启动,就 tidb alertmanager grafana prometheus
没法启动,求帮助!

应该是是端口占用的问题,或者端口不通,可以看下tidb机器上面有没有已经启动的4000端口,9100端口之类的,另外看下防火墙是否开启,还有日志最好把信息脱敏下,ip之类的,这样安全点

感谢 已经脱敏过了。防火墙是关闭的,本地可以查看到tidb服务是运行的,

正常没有start的时候4000端口不会启动,start的时候会启动,如果start的时候发现4000端口被占用,就会启动不起来,我是这么理解的,新环境你可以看下上面tidb是怎么启动的,kill掉,或者systemctl stop掉,然后用tiup启动下tidb看看, --wait-timeout可以增加启动时长

感谢您的回复,我重新安装操作系统后,又跑了一遍,正常了。我回想了下操作,并非是操作有什么问题,我在没法启动的节点上查看的时候,服务都是正常的,只有在tiup 服务器上启动的时候是Down的状态,在此之前我有去执行 --check参数去检测配置,也是一路跑下来的。看来这个看人品的成功率(甚是难受)

该主题在最后一个回复创建后60天后自动关闭。不再允许新的回复。