tiup 停止和销毁集群失败 Stopping component node_exporter

使用tiup命令$ tiup tidb-test stop
报错。

node_exporter 组件关闭失败,

  1. 登录远程服务器检查该组件是否被正常关闭,
  2. 检查其 log 看是否报错并进行修复,
  3. 可以使用 stop --force 跳过此错误进行关闭集群。
    tiup 使用及其他相关问题环境根据此帖先进行排查
    TiUP 使用常见问题处理

stop --foce 命令如何使用?

手动去服务器上kill 9100端口占用的进程,kill之后又会自己起来新的

使用 systemctl stop 停止该服务。

已经使用systemctl stop在对应节点上停止了node_exporter服务,再次使用tiup cluster stop cluster-test 命令仍然失败

sorry --force 貌似不能应用到 stop 命令中,详细参数使用 tiup cluster stop --help 进行查看。

辛苦反馈下 node_exporter log 看下,位置在 monitor deploy dir 下。
并且查看系统 message 看下是否有其他报错信息可以查看

试了下,可以使用tiup cluster destroy tidb-test --force 重新部署 会跳过node_exporter timeout 问题

是的,但是整个集群的数据就没有了,需要考虑对这个集群的定位吧。

我这边也遇到这个问题,发现无法stop的其实是exporter node的监控的端口,一直在跟redis通讯。怀疑是这个node被机器上其他的组件共享了,所以一直处于占用状态。