TIKV报错 code: 8-RESOURCE_EXHAUSTED, message: \"the number of received snapshot tasks 32 exceeded the limitation 32

【 TiDB 使用环境`】生产环境
【 TiDB 版本】5.1.4
【遇到的问题】
【复现路径】
删除了300G数据
【问题现象及影响】
[snap.rs:457] [“failed to send snap”] [err=“Grpc(RpcFailure(RpcStatus { code: 8-RESOURCE_EXHAUSTED, message: "the number of received snapshot tasks 32 exceeded the limitation 32", details: }))”] [to_addr=10.70.53.240:20170]

【附件】

请提供各个组件的 version 信息,如 cdc/tikv,可通过执行 cdc version/tikv-server --version 获取。

这个问题应该是和 参数concurrent-send-snap-limit相关,当遇到这个问题的时候,是需要调大这个参数吗?

嗯,可以调大一下这个参数

关键是一般都是生产,要重启的,怕流量波动

这个参数有建议值吗

看报错只能调大 concurrent-send-snap-limit了,默认的32已经不能满足snapshot任务数了

1 个赞

这个没有好的建议,这个太大了也会影响性能的,不过建议看看 snaoshot 相关的监控,感觉可以排查一下 tikv 是不是太忙了,或者 网络资源使用情况