启动cluster时在exporter部分fail

【 TiDB 版本】
v5.0.3
【概述】场景+问题概述
通过deploy部署tidb并成功了,随后在执行tiup cluster start *cluster-name 命令是出现下列报错:
。。。
Starting component blackbox_exporter
Starting instance x.x.x.x
Starting instance x.x.x.x
Starting instance x.x.x.x

Error: failed to start: x.x.x.x blackbox_exporter-9115.service, please check the instance’s log() for more detail.: timed out waiting for port 9115 to be started after 2m0s

Verbose debug logs has been written to /home/tidb/.tiup/logs/tiup-cluster-debug-2021-08-05-20-15-21.log.
Error: run /home/tidb/.tiup/components/cluster/v1.5.2/tiup-cluster (wd:/home/tidb/.tiup/data/SfDMrhJ) failed: exit status 1

【背景】做过哪些操作

没有blackbox_exporter的相关日志,node_exporter日志中也没有报错。

topology.yaml 如附件所示topology.yaml (1.8 KB)

此外
tiup检查集群状态均为UP,也能登录tidb操作

1 个赞

检查下那台节点上的9115端口有没有起来,或者是不是被别的进程占用了

tiup检查集群状态均为UP,也能登录tidb操作

您参考这个帖子排查下https://asktug.com/t/topic/69603

使用该方法可以启动blackbox_exporter了,
但是系统日志中仍有以下报错:
Sep 6 03:50:08 backup23-prod-py-vianetbm5.host.luckincoffee.com run_node_exporter.sh[37942]: time=“2021-09-06T03:50:08+08:00” level=error msg=“ERROR: cpu collector failed after 0.002637s: open /sys/devices/system/cpu/cpu1/cpufreq/cpuinfo_cur_freq: permission denied” source=“collector.go:132”

从报错信息看是权限问题,参考下这篇文章看看https://asktug.com/t/topic/95777

请教下 up主,该问题是如何解决的,我这边也遇到相同的问题

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。