关于tidb_tikvclient_backoff_seconds_count 频繁

LongSky · 2022 年4 月 2 日 07:34

【现象】：业务每天都是先删除数据后入数
tidb_tikvclient_backoff_seconds_count参数调大到1000 后，还是频繁告警。再继续调整阀值，那这个监控的意义有什么？除了调整阀值，还可以进行哪些优化？

h5n1 · 2022 年4 月 2 日 07:48

看下监控 TiDB -> kv errrors和tikv detail -> errors哪些比较高

啦啦啦啦啦 · 2022 年4 月 2 日 07:56

tidb_tikvclient_backoff_seconds_count是tidb中比较常见的告警了，可以参考以下帖子

LongSky · 2022 年4 月 2 日 08:17

看了的。既然这个这么容易出现初始化的阀值这么低是基于什么考虑的？我也不可能无限调高阀值。加这个监控的意义在哪里？如果只是修改值的话。

LongSky · 2022 年4 月 2 日 08:18

主要还是region调度问题发生这个告警的时间段伴随大量写入。

yilong · 2022 年4 月 6 日 06:34

LongSky · 2022 年4 月 12 日 05:01

主要是not leader。

只有regionmiss有数值其他都是0
查看tidb_slow_query.log 中有很多regionmiss信息。
查看tikv.log中有很多 Region error (will back off and retry) message警告。

Hacker_xUwtuKxa · 2022 年4 月 12 日 05:32

backoff次数增加，会导致sql性能变慢，同时体现有pd访问tso的次数增加。

system · 2022 年10 月 31 日 19:18

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。