tidb 4.0.13版本
企业微信告警如下图,近日发现TiKV_server_report_failure_msg_total部分的告警的故障主机部分为空。
prometheus的配置都是默认的,TiKV_server_report_failure_msg_total段的配置如下
tidb 4.0.13版本
企业微信告警如下图,近日发现TiKV_server_report_failure_msg_total部分的告警的故障主机部分为空。
prometheus的配置都是默认的,TiKV_server_report_failure_msg_total段的配置如下
alertmanager 前面有一个 sum by store id。
尝试把这个 sum by(store_id) (rate(tikv_server_report_failure_msg_total{type=“unreachable”}[10m])) > -1
的 sum 表达是去掉,可以看到 instance 的信息
此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。