升级到7.5之后tidb_monitor_keep_alive_total指标不见了,而这个指标是用来监控 tidb-server 可用性的告警,可以见: https://docs.pingcap.com/zh/tidb/stable/alert-rules#tidb_monitor_keep_alive 。这样即便 tidb-server 发生重启或者不可用,也没办法及时探测到了。
搜了一下代码,发现确实已经搜不到了,只能看到告警规则还在
1 个赞
https://github.com/pingcap/tidb/issues/40143
貌似找到关闭的原因了,不过这个并没有提现到 release-note 里,对应的告警规则也没有变化,还是用的keep_alive_total这个指标。
1 个赞
自问自答哦,谢谢楼主的经验分享!
多谢分享
此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。