救急!!!,生产集群崩了,pd没办法选举

【 TiDB 使用环境】生产环境
【 TiDB 版本】6.5.0

【遇到的问题:问题现象及影响】

误操作扩容pd,使用了外网的ip进行扩容,因为原集群的ip都是内网,所以出现了pd联不通的情况。扩容后集群就无法访问了,我尝试将新扩容的节点缩容或者新扩容一个其他内网节点,都不行。

pd一直尝试连接这个公网的pd,但是这个pd已经下掉了

tidb start尝试启动,报错:

麻烦大佬看看有没有办法恢复,或者麻烦大佬们帮忙远程修复下,有偿

【资源配置】
【附件:截图/日志/监控】

新扩容的节点删了?只看到2个节点呢。重启过没?2个节点无法选leader

尝试过扩容、缩容、重启,可能是配置都乱了

  1. 先通过tiup 进行外网环境的节点实例下线处理,直接缩容掉

  2. 在通过 tiup 启动内部的 集群,观测错误情况

  3. 根据错误日志,逐步排查问题,一 一 解决为好

1 个赞

可以参照这个来处理,将外网IP改为内网IP

1 个赞


我把原来的文件名称换了,执行tiup cluster reload main_tidb -R pd --force的时候报错了

报错是网络不通么?

-R 是个 角色参数。 意思是启动所有角色。 会导致 整个集群可能崩溃的。 以后请使用 -N 等参数一个一个节点进行重启

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。