region is missing问题

版本:4.0.10
6个tikv节点,不时的刷这样的日志:


但是又从pd-ctl查询又是正常的:
image

image

如果少数报错,可以忽略哈 ~ 可能是 热点 或者 负载均衡 的调度以后,然后后台机制里面会有 backoff ,发现 region 的地址变化,backoff 成功就好了。

背景是改了os的参数,轮询(每个节点相隔3-5分钟)重启了所有的tikv pd 和tidb-server节点,重启步骤是tikv–》pd+tidb,因为是测试环境,当时也没有考虑前后关系,时候觉得应该先重启pd节点,其次再重启tikv节点比较好。

数据量有1T,重启后12小时了,还是刷错
[err=“Region error (will back off and retry) message: “region 2550620 is missing” region_not_found { region_id: 2550620 }”]
[endpoint.rs:537] [error-response] [err=“Region error (will back off and retry) message: “peer is not leader for region 2541904, leader may Some(id: 2551448 store_id: 25334)” not_leader { region_id: 2541904 leader { id: 2551448 store_id: 25334 } }”]
[2021/08/19 17:21:32.070 +08:00] [WARN] [endpoint.rs:562] [“region not found on incremental scan”] [region_id=2510346]
[2021/08/19 17:21:37.589 +08:00] [WARN] [mod.rs:89] [“handle task CheckAndCompact { cf_names: [“default”, “write”], ranges: (Some(7A7480000000000004FFFD5F728000000000FF1E364F0000000000FA), Some(7A7480000000000004FFFF5F728000000000FF0FB0A70000000000FA)), tombstones_num_threshold: 10000, tombstones_percent_threshold: 30 }”] [takes=44853]




当前没有任何写入,还是有刷错

主要是当前集群是空载的情况下,各个tikv节点都在刷这些错误。

可以持续关注一下报错的 region ,看看 region group的 peer 、leader 状态是否正常。应该没有影响。

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。