TiKV下线卡住

有啊,3.7完成的下线上线操作。3.9今天来看,就是这样的。

Tombstone Stores是记录下线成功的 TiKV 节点数量,因此看到这些信息是正常的

可是下线的2个TiKV,我已经恢复上线成功了呀!

集群部署可以参考问题描述中的图片,一共就6个TiKV。显示了6个TiKV为Up,为什么还会显示2个为Tombstone?

Tombstone Stores是记录下线成功的 TiKV 节点数量,后续下线这个数值还会增加

也就是说Tombstone Stores记录的是:当前集群【历史】下线成功的TiKV数量?该数值只会增加,不会减少?

是的,记录的是下线成功的历史累加值,除非通过 pdctl remove tombstone 主动清理,否则一直都存在

  1. 命令是pd-ctl -d remove-tombstone?提示说无该命令。我的tidb版本是2.1.6。
  2. 麻烦再问一下,监控图片中,Leader Balance Ratio和Region Balance Ratio为什么都是红色的100%啊?之前正常都是绿色的很小的数字。
  1. pd-ctl 工具的用法参考这里
  2. 能截图上传一下吗?
  1. 你给的链接里没有找到remove-tombstone命令。

根据官网说明,直到2.1.17才支持remove-tombstone(我的是2.1.6):

https://pingcap.com/docs-cn/v2.1/releases/2.1.17/#tidb-2117-release-notes

image

请问,除了升级版本没有其他办法删除tombstone store了吗?

  1. 是的,建议升级一下
  2. Leader Balance Ratio 和 Region Balance Ratio 的含义如下:
  • Leader Balance Ratio:Leader 数量最多和最少节点相差的百分比,一般小于 5%,节点重启时会有比较大的波动
  • Region Balance Ratio:Region 数量最多和最少节点相差的百分比,一般小于 5%,新增/下线节点时相差比较大

请问,这种手动改成Up状态,有没有其他的潜在风险或者问题?谢谢

Offline 状态修改为 Up 没有风险,一般用于误操作执行 store delete 后的 revert 撤销动作,对于已经变成 Tombstone 状态的 store 则不适用

如果是执行scale-in后Pending Offline,修改回Up,会有风险吗?

没风险,就是改个状态

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。