监控报警问题

【 TiDB 使用环境】生产环境
【 TiDB 版本】6.5
【复现路径】修改了部分用户权限,但是看起来没有关联
【遇到的问题:问题现象及影响】查询有两三分钟查不出来,业务反馈报错,暂时无报错信息,这是找出来近一周之内,异常监控,符合问题发生时间(11点20)

还原操作后是否正常

没进行还原操作,过两分钟自己好了


目前找到的最合理解释,但是不知道咋论证 :sweat_smile:

tikv和tidb的对应时间点的日志应该有很多epoch not match类似的日志,这种一般是集群负载太大了,region信息变化快,导致一直获取到过期的region信息。

看起来是的,高负载状态大概持续了40分钟,但是tidb从开始卡了两三分钟就恢复正常查询了

太忙了吧,back off多

这段时间负载大了

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。