tidb,tikv自动重启报警如何配置

【 TiDB 使用环境】生产环境
【 TiDB 版本】
4.0.13
【复现路径】做过哪些操作出现的问题

【遇到的问题:问题现象及影响】


只有down的报警,没有重启的报警,最近一次tikv重启没有报警,想添加一下监控,找了好多资料没有找到,哪位大佬配置过

监控 uptime 就行了。

你看下tidb-deploy/prometheus-8249/conf/tikv.rules.yml 配置文件中有重启的告警规则

  • alert: TiKV_node_restart

没有,是不是要添加进去这个,(time() - process_start_time_seconds{tidb_cluster=“”, job=“tikv”})

设置这个小于多少报警

我的配置文件给你参考下
tikv.rules.yml (14.3 KB)

好的,这个是你后面自己加的吧,原来的应该没有

不是后加的,默认自带的

是我这版本太低吗

确实是版本原因,我这个6.5.5里面也有,就是不知道加进去,能不能识别

你这版本太低了吧?不知道生效不生效,可以测试一下

process_start_time_seconds 这个是4.0.2加的 应该能生效


测试,确实可以,感谢

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。