tidb因上次tikv故障手动tiup cluster命令重启后,原本自动部署的监控程序脚本(run_xx.sh)无法启动监控程序,手动启动alertmanager,prometheus,grafana后,tiup cluster display显示异常
虽然影响不是很大但还是想请教下是不是哪里有问题,谢谢
- run sh 脚本内容是否修改过
- run 脚本执行是否有报错,或者有什么输出吗。
- 目前使用 tiup clsuter restart 可以正常执行吗。
1.修改后也会被重置
2.run脚本单独执行没有问题,但根据整个cluster重启时,我认为监控时要一并重启的,但此时不work,tidb cluster重启后监控起不来
3.可以正常执行,但监控部分报错如下:
是的,为了保证集群的完整性,restart 如果某个节点没有启动将会终止启动之后的节点,
看下 promethce log 是否有错误输出呢。
检查下 edit-config 和 promethce 的实际端口 ip 等信息是否相符、
能否看下未能正常启动的服务的日志