使用TIUP下线TiKV,长时间无法成功

下线TiKV,剩最后一个leader和4个region,等了一天多,都没成功。

%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20200611100404

你好

由于当前 store 上少数 leader 和 region 可以进行如下操作,完成节点的下线工作:

  1. 查看下线节点的调度策略和 max-replicas:pd-ctl scheduler show/config show
  2. 将 store id = 49133 的 剩余 leader 迁移走: scheduler add evict-leader-scheduler 1
  3. 由于 49133 上存在 4 个 region ,但是为集群中少数副本(3 副本),可以直接将其状态设置为 tombstone。当扩容新的节点时。该副本将自动补齐:curl -X POST ‘http://pdip:pdport/pd/api/v1/store/{id}/state?state=Tombstone’

关于第3点,不太理解。leader我没动,过了一上午,已经没了。现在就剩4个region了。这4个region没有迁移掉的原因是什么?TiKV还有三台在工作,然后副本数量是默认值,没动过。

节点下线慢,可以调整下面的参数来加快下线:

image
https://pingcap.com/docs-cn/stable/reference/best-practices/pd-scheduling/#%25E8%258A%2582%25E7%2582%25B9%25E4%25B8%258B%25E7%25BA%25BF%25E9%2580%259F%25E5%25BA%25A6%25E6%2585%25A2
也可以通过

>> operator add transfer-region 1 2 3 4                 // 把 Region 1 调度到 store 2,3,4

手动做一下