消除告警,调整参数

修改/tidb-deploy/prometheus-8249/conf/tidb.rules.yml 文件中参数

labels:
env: tsp-prod-tidb-cluster
level: warning
expr: increase( tidb_tikvclient_backoff_seconds_count[10m] ) > 10

然后重启prometheus服务

TiDB_tikvclient_backoff_seconds_count

  • 报警规则:increase(tidb_tikvclient_backoff_seconds_count[10m]) > 10
  • 规则描述:TiDB 访问 TiKV 发生错误时发起重试的次数。如果在 10 分钟之内重试次数多于 10 次,则报警。
1 个赞