TiDB 的问答社区

升级集群之前检查集群有pending-peer ，这个应该如何处理

🪐 TiDB 技术问题

Mwkk (Ti D Ber A Cla Yr Lb) 2024 年10 月 18 日 01:05 1

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】
【复现路径】做过哪些操作出现的问题
【遇到的问题：问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件：截图/日志/监控】
有一个v4.0.8 的集群打算升级，在做 tiup cluster check xxx --cluster 预检查时，发现有5个 pending-peer ，这个应该如何处理

啦啦啦啦啦 2024 年10 月 18 日 01:10 2

有副本的raft log有延迟吧，等几分钟再检查下呢

Mwkk (Ti D Ber A Cla Yr Lb) 2024 年10 月 18 日 01:12 3

这个集群2天前迁移过一个 tikv 节点，从监控看， pending peer 的数量没有减少过

Kongdom (Kongdom) 2024 年10 月 18 日 01:12 4

可以观察一下grafana中pd-region health里面的pending-peer-region-count，降为0就是正常了。
Pending 表示 Follower 或 Learner 的 raft log 与 Leader 有较大差距，Pending 状态的 Follower 无法被选举成 Leader。

Kongdom (Kongdom) 2024 年10 月 18 日 01:13 5

我觉得没有减少是因为那5个都down了。

Mwkk (Ti D Ber A Cla Yr Lb) 2024 年10 月 18 日 01:13 6

看过这个监控了，这个 pend 的 region 有什么处理方法吗

Kongdom (Kongdom) 2024 年10 月 18 日 01:14 7

是不是tiflash的问题？有tiflash么？

Mwkk (Ti D Ber A Cla Yr Lb) 2024 年10 月 18 日 01:16 8

这个集群没有 tiflash

Kongdom (Kongdom) 2024 年10 月 18 日 01:17 9

learner-peer-region-count就是tiflash的。是以前有过，然后缩容了么？

Mwkk (Ti D Ber A Cla Yr Lb) 2024 年10 月 18 日 01:18 10

这个倒不清楚，也是接手前任大哥留下的集群。

Kongdom (Kongdom) 2024 年10 月 18 日 01:21 11

执行这个看看有没有tiflash副本？
SELECT * FROM information_schema.tiflash_replica

另外display一下集群，看看集群状态和组件

Mwkk (Ti D Ber A Cla Yr Lb) 2024 年10 月 18 日 01:34 12

Mwkk (Ti D Ber A Cla Yr Lb) 2024 年10 月 18 日 02:33 13

现在通过 pd-ctl 找到了 pend 的region id ，从状态看是 down 状态的，我想直接 remove 掉，在用
tiup ctl:v4.0.8 pd -u xxx:yyy operator add remove-peer 136571147 130872539
的时候，提示 Failed! [500] “region 136571147 not found”

Kongdom (Kongdom) 2024 年10 月 18 日 02:52 14

感觉是之前强制下线遗留的问题。

Mwkk (Ti D Ber A Cla Yr Lb) 2024 年10 月 18 日 03:12 15

解决了-，-其实就是上面的 remove-peer ，开始看错了，把 peer id 当成 region id 传进去了，所以一直在报错

Kongdom (Kongdom) 2024 年10 月 18 日 03:38 16

为你点赞，能接盘的都是大难

system (system) 关闭 2024 年10 月 25 日 05:44 18

此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。

©2023 TiDB Community. 京ICP备20022552号-5 京公网安备11010802043344号