使用tiup关闭集群,其它组件关闭完成,blackbox未关闭,是何原因,请大佬指教

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】6.1.4
【复现路径】tiup cluster stop ${cluster-name}
【遇到的问题:问题现象及影响】使用tiup关闭集群,其它组件关闭完成,blackbox未关闭;之后单独手动执行关闭blackbox完成。
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】
Error: failed to stop: 10.10.0.1 node exporter-9100.service, please check the instance’s log() for more detail.: timed out waiting for port 9100 to e stopped after 2m0s

2024-06-12T16:57:17.026+0800 INFO Execute command finished {“code”: 1, “error”: “failed to stop: 10.10.0.1 node_exporter-9100.service, please check the instance’s log() for more detail.: timed out waiting for port 9100 to be stopped after 2m0s”, “errorVerbose”: “timed out waiting for port 9100 to be stopped after 2m0s\ngithub.com/pingcap/tiup/pkg/cluster/module.(*WaitFor).Execute\n\tgithub.com/pingcap/tiup/pkg/cluster/module/wait_for.go:91\ngithub.com/pingcap/tiup/pkg/cluster/spec.PortStopped\n\tgithub.com/pingcap/tiup/pkg/cluster/spec/instance.go:130\ngithub.com/pingcap/tiup/pkg/cluster/operation.systemctlMonitor.func1\n\tgithub.com/pingcap/tiup/pkg/cluster/operation/action.go:338\ngolang.org/x/sync/errgroup.(*Group).Go.func1\n\tgolang.org/x/sync@v0.0.0-20220819030929-7fc1605a5dde/errgroup/errgroup.go:75\nruntime.goexit\n\truntime/asm_amd64.s:1594\nfailed to stop: 10.10.0.1 node_exporter-9100.service, please check the instance’s log() for more detail.”}

please check the instance’s log() for more detail.” 去看下blockbox的日志,

应该是报错了,看一下日志里的描述

blackbox_exporter.log 里只有当时启动时的日志

单机部署的吗? tiup cluster display 看看

不是单机
alertmanager 10.10.0.1 9093/9094 linux/x86_64 Down
grafana 10.10.0.1 3000 linux/x86_64 Down
pd 10.10.0.2 2379/2380 linux/x86_64 Down
pd 10.10.0.1 2379/2380 linux/x86_64 Down
pd 10.10.0.3 2379/2380 linux/x86_64 Down
prometheus 10.10.0.1 9091/12020 linux/x86_64 Down
tidb 10.10.0.2 13306/10080 linux/x86_64 Down
tidb 10.10.0.1 13306/10080 linux/x86_64 Down
tidb 10.10.0.3 13306/10080 linux/x86_64 Down
tikv 10.10.0.2 20160/2010 linux/x86_64 N/A
tikv 10.10.0.1 20160/2010 linux/x86_64 N/A
tikv 10.10.0.3 20160/2010 linux/x86_64 N/A

手动停止 node_exporter试试看

可以多次关闭试试,我在关闭过程中也遇到类似问题 。一般都是因为延时引起的。

后面就是手动停止的

试了两次没关掉,后面就手动了

后面手动关掉的;配置是参考官网的配置

我有时候启动集群也有这个超时的错误,部分服务超时

报错了吧

啊,启动也有

附件贴了有一点

看下对应启动脚本内容:

看看日志有没有什么记录。:thinking:
正常关闭和启动都很快的。