多副本损坏修复时,执行store delete <store_id>报错

【 TiDB 使用环境】生产环境 /测试/ Poc
测试
【 TiDB 版本】
v7.1.0
【复现路径】做过哪些操作出现的问题
我有三个tikv节点(单机部署),删除了2个tikv的磁盘数据,然后根据 【SOP 系列 18】TiUP 环境恢复 TiKV 副本 去尝试修集群,在链接中的 7. 重启集群,这时候丢失的 data 目录会自动补数据,但是 tikv 日志会报重复 store 的错误,之后我停掉正常的tikv节点后, 执行store delete <store_id> 出现错误,无法删除,报错信息请见下面的截图
【遇到的问题:问题现象及影响】
执行store delete <store_id> 出现错误,无法删除
【资源配置】

【附件:截图/日志/监控】


1 个赞

先扩容两个节点试试

2 个赞

缩容之前必须先让集群是正常的,而且是健康的才行…

环境恢复有两种:

  1. 副本存在,可扩容节点,满足副本自动补充
  2. 副本丢失,只恢复集群

不论是那种,都需要保证集群是正常的,才能执行其他的操作…

1 个赞

1、 测试环境想省事,就重新部署下吧。
2、非得要把原来集群恢复,就按前面说的扩2个tikv ,要用不同端口和路径
3、 store delete <store_id> 会把删除的store上的副本迁移到其他节点,前提条件是你得有可用节点接受副本,3副本配置下,得有3个可用tikv

1 个赞

好的,感谢各位,我扩容了2个tikv,确实成功了。

应该是副本不够

1 个赞

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。