Regions are not fully healthy: 1 pending-peer

一直删不掉啊

remove-peer 不好使 卡在那

我的意思是: remove-peer 是先删除 已下线store 上的 peer(其实这个问题:正常根据 region id 或 peerid 过滤 pd leader的日志,日志里会有到对应那个 store 进行哪些操作,然后到对应的 store 看看操作除了啥问题)

是操作一下,看一下pd的日志吗?

嗯嗯,上面不是知道了 那个 region 有 pending peer 吗,根据这个 region id 过滤一下 pd leader 的日志(如果没有,可以添加一个。operator add remove-peer的操作,。或者看以前的日志也行)

情况咋样了,或者能给一下 pd 和 对应 store 的 日志不(应该是 2个 store),我也想看看日志:grinning:

看看 这个 store 的日志,为啥这么就没有返回 添加 peer 成功


1、先store 55179137 看看是那个 ip
2、然后grep 71253 tikv.log 就行

store=4和store=55179137的ip都是192.168.1.154,之前是store=4,现在是store=55179137

grep 71253 tikv.log 没有搜到结果

但是154的tikv在报错

停机能删吗?

停机删什么意思,删peer吗?

是的,比如我把3个tikv有问题的那个tikv停掉,删store或peer

grep 不到?没进错 store ?pd-ctl store 55179137命令,能输出这个 store 的 deploy 目录,进入这个目录下的 log 目录下,直接 grep 71253 * 呢

没法停掉处理,因为这些涉及元数据信息,只能通过目前tidb提供的方式处理

就这1个region有问题,还有2副本是正常的,能不能直接补一个副本。然后强制把store 4标记成tomb?

store4已经是Offline状态

不是offline,是改成tomb。我找下命令。

curl -X POST http: // {pdip}:2379 /pd/api/v1/store/ ${store_id} /state ?state=Tombstone

这个操作等大佬@spc_monkey 确认下再搞吧。把store4强制下线。