tidb_tikvclient_backoff_seconds_count value 近万

【 TiDB 使用环境】生产环境
【 TiDB 版本】v6.1.2
【复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
【资源配置】
【附件:截图/日志/监控】


你想咨询的问题是什么?

能不能看出什么问题呀,阈值我都调到3000 了还是一直报警;
我V5.2.1 的集群 阈值100 就不报警了

发一下告警信息看看?可能是其他任务 pending 或者监控数据问题。

我们6.1版本的,一天报个十条吧

看一下日志里面backoff的报错日志,看看都是因为什么报错的

从提供的监控告警截图来看,这个总量达到了 w 级别,但是有时不同类型的告警。需要确认一下实际的监控是否有这么多数值。你上面的监控截图里面是 10 小时的,这个监控数据统计应该不只 10 小时应该是全部的。现在的影响是什么?而且看最下面的截图应该不是报警信息,是监控信息,这个策略是怎么设计的?

你告警阈值是不是填错了,用max值不是total值吧?

需要发出对应的告警表达式,或告警信息,才能针对性分析。

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。