grafana及相关组件Down

【 TiDB 使用环境】 测试环境
【 TiDB 版本】V6.5.2
【复现路径】主控机上安装了tidb的alertmanager\grafana\prometheus组件,运行正常,页面运行正常,今天,在主控机上安装DM时,配置安装文件时将DM的alertmanager\grafana\prometheus组件和tidb的IP:PORT写成一样的了,安装DM完成后发现不对,查询tidb集群的上述组件状态正常,于是使用tiup dm destory dm删除了dm,再次查询TIDB的组件,已经Down了。
【遇到的问题:问题现象及影响】组件Down了以后,尝试tiup start tidb -R grafana和tiup satrt tidb -N ip:port,均无法启动起来,报错如下:
Error: Failed to start alertmanger:failed to start :21.72.124.43 alertmanager-9093,service,please check the instance’s log(/tidb-deploy/alertmanager-9093/log) for more detail,:excutor.ssh.execute_failed:Failed to execute command over SSH for ‘tidb@21.72.124.43:22’ {ssh_stderr:Failed to start alertmanger-9093.server: Unit not found.,ssh_stdout: , ssh_command: export LANG=C; PATH=$PATH:/bin:/sbin:/usr/bin:/usr/sbin /usr/bin/sudo -H bash -c “systemctl deamon-reload && systemctl start alertmanager-9093.service”},cause:Process exited with status 5
有业务和数据在跑,所以我没法删除TIDB集群重建,也没办法停TIDB其他模块。

alertmanager\grafana\prometheus组件缩容,然后再扩容,不需要重建集群

1 个赞

已缩容,再扩容了,有点恶心的是,扩容时报错提示互信有问题,ssh了一下,果然之前配好的互信都没有了,又挨个节点配了一遍互信!可能是之前配置DM的时候,把互信给毁了吧!

配置DM应改不会自动删除互信吧

不会删除互信

嗯,是不会删除互信,但是在配置DM时,我的语句写的有问题,安装语句写了 -uroot -ptidb了,带了密码了,是否此原因也未可知

安装语句带密码也没啥问题,应该不是这里的问题

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。