修改/tidb-deploy/prometheus-8249/conf/tidb.rules.yml 文件中参数
labels:
env: tsp-prod-tidb-cluster
level: warning
expr: increase( tidb_tikvclient_backoff_seconds_count[10m] ) > 10
然后重启prometheus服务
TiDB_tikvclient_backoff_seconds_count
- 报警规则:
increase(tidb_tikvclient_backoff_seconds_count[10m]) > 10
- 规则描述:TiDB 访问 TiKV 发生错误时发起重试的次数。如果在 10 分钟之内重试次数多于 10 次,则报警。