资源充足，但是tikv有一些warn报警，请教大佬如何优化性能 tidb_tikvclient_backoff_seconds_count region_miss

Billdi表弟 · 2023 年3 月 21 日 03:13

考试没答案 · 2023 年3 月 21 日 03:20

那个region 有属于上面的分析的表不？？那个时间段

Billdi表弟 · 2023 年4 月 7 日 02:16

我现在资源不是瓶颈

Billdi表弟 · 2023 年4 月 7 日 02:16

没有，现在表就晚上凌晨低峰分析

tidb狂热爱好者 · 2023 年4 月 7 日 02:23

这好像是6.5.1的bug 在修了

魔礼养羊 · 2023 年4 月 7 日 02:39

从你的日志来看，应该是region找不到或者region leader找不到。
参考原理来看，正常的region做merge或者分割都可能。所以你考虑一下是不是有同时大量的序列写入或删除导致region的分割和归并工作太多。
如果是顺序写入，应该属于正常，如果是离散写入，应该稍微有点不正常。从目前来看，不算问题。

Billdi表弟 · 2023 年4 月 7 日 03:26

你有升级到6.5.1吗

Billdi表弟 · 2023 年4 月 7 日 03:26

写入的量不算大还好，我最大写入是一个分区表，按照时间range分区的，还把时间字段加了索引，业务特征使然

Billdi表弟 · 2023 年4 月 7 日 03:28

这个问题应该很多人都碰到过。资源占用不多，理论上没有这个问题的。

小王同学Plus · 2023 年4 月 10 日 02:36

这个报警的可以参考官网 https://docs.pingcap.com/zh/tidb/v6.1/alert-rules#tidb_tikvclient_backoff_seconds_count

TiDB 访问 TiKV 发生错误时发起重试的次数。如果在 10 分钟之内重试次数多于 10 次，则报警。这个还是要看发生重试的类型是哪种

可以在 overview 面板中 —> KV Backoff OPS 中，可在下面加个表达式看看具体是哪个指标触发的。
increase(tidb_tikvclient_backoff_seconds_count[10m]) > 10

Jiawei · 2023 年4 月 10 日 03:49

之前有遇到过是因为锁的原因导致重试请求，tikv日志里面会有比较多的锁等待的相关日志，最后优化业务逻辑解决，可以参考下

Billdi表弟 · 2023 年4 月 10 日 08:09

已经报出来了，有错误原因

Billdi表弟 · 2023 年4 月 10 日 08:09

这个错误频繁的报警让人头疼

Billdi表弟 · 2023 年4 月 10 日 08:10

其实我的写入并不大

Billdi表弟 · 2023 年4 月 12 日 06:39

知道指标了又咋样尼？无法解决，为什么会不断重试尼

Billdi表弟 · 2023 年4 月 12 日 06:40

我的业务是按照时间分区，并且时间加索引，这个不太好调整的。因为要按照时间排序

Billdi表弟 · 2023 年4 月 12 日 06:41

大佬们，按照时间排序的就没有什么好的办法解决吗

TiDBer_oqrCNpbV · 2024 年3 月 4 日 03:41

兄弟，告警解决了吗