tidb_tikvclient_backoff_seconds_count 不断报警,如何调整报警规则

【 TiDB 使用环境】
【概述】:场景 + 问题概述
【背景】:做过哪些操作
【现象】:业务和数据库现象
【问题】:当前遇到的问题
【业务影响】:
【TiDB 版本】:
【TiDB Operator 版本】:
【K8s 版本】:
【附件】:

这个在延迟不敏感的业务场景,可以调大,比如调到100.

找到对应的prometheus的rules(tidb.rules.yml),修改监控规则,然后固化配置文件。
使用 TiUP 部署运维 TiDB 线上集群 | PingCAP Docs

1 个赞

使用 TiDB Operator 部署的,https://raw.githubusercontent.com/pingcap/tidb-operator/master/examples/basic/tidb-monitor.yaml, 这个如果修改

改阈值吧

这个值我以前改过,直接改配置文件的阈值重启下prometheus就行了。不过我改的是3.0的,4.0之后应该直接tiup就能操作

1 个赞

官方文档https://docs.pingcap.com/zh/tidb/v4.0/alert-rules

1 个赞

https://docs.pingcap.com/zh/tidb/v4.0/configure-memory-usage#tidb-server-内存占用过高时的报警

tidb-server 实例会在机器内存使用达到总内存量的 80% 时打印报警日志,并记录相关状态文件。该内存使用率可以通过配置项 memory-usage-alarm-ratio 进行设置

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。