大量tikv_coprocessor_request_error报警

not leader 是正常的报错情况,leader 调度比较频繁,region cache 过期就可能会导致 not leader 的报错。因为 tidb 拿之前的 region 信息去对应节点上访问 region leader 的时候,发现 leader 已经被调度到别的节点上了,这时候就会报 not leader 的错误。遇到 not leader 错误, tidb 会重试,重新从 pd 获取最新的 region 信息或者 tikv 在返回错误时会返回最新的 leader 信息给 tidb ,tidb 根据新的 leader 信息重新访问到正确的 leader 节点。

可以确认下业务是否有感知影响,如果业务没有特别感知,可以考虑调高这个告警阈值。