如何紧急修复集群

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】v6.5.3
有个简单的tidb集群,3台机器,一个机器上装有一个tidb-server,一个pd,一个tikv,目前遇到的问题是两台机器故障不可用,磁盘完成。换了两台新的机器,新的IP,把磁盘挂载上去,如何修复这个集群。

我是通过pd-recovery进行尝试修复,没有成功。
因为集群不可用了,我重新安装了集群,然后stop集群,把磁盘挂载上去,在一台机器上执行pd-recovery成功,后来只有这个pd能够启动,其他都不行

可以根据这个帖子,尝试修复: 【SOP 系列 12】TiUP 修改集群 IP 、Port 和目录 - :milky_way: 运维指南 / TiDB 运维手册 - TiDB 的问答社区 (asktug.com)

新IP,要改配置文件

你这有点麻烦,我的建议是如果能改ip的话,直接把异常的两台机器ip释放出来,把新的机器的ip修改为原来两台机器的ip,并且挂在上和原来ip一样的磁盘,然后直接启动下集群试试能不能起来。。。
如果不能改ip只能按集群迁移ip来做了,pd需要重建

我测试环境出现过这种类似问题,可以参考一下,看对你是否有帮助。
网络故障集体迁移IP故障恢复过程 - :milky_way: 运维指南 / TiDB 常见 FAQ - TiDB 的问答社区 (asktug.com)

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。