中控机挂了,如何在别的节点管理集群信息

【 TiDB 使用环境】
V5.0.2 中控机因为未知原因挂机了,且启动不了了,硬盘的东西也拿不出来了,在拿不出来中控机集群信息的前提下,有没有可能在别的节点重新获取和管理现有集群

在其他的服务器上,重新部署 tiup,重新编辑一样的 topology 文件,部署集群(应该是只需要 deploy 一下就OK)(不过建议测试环境测试一下这个步骤,只是理论上 这样OK)

刚才试了一下,不需要启动就OK ,不过我还没有做修改集群参数等实验(关停是ok 的)

1赞

另外,建议隔段时间,可以备份一下中控机的 .tiup 目录(可以写个脚本等方式)

我赶紧去试下

ok:call_me_hand::call_me_hand:

大佬,可以了,太厉害了,还有个问题是,这个中控机同样也是一个pd和tidb server节点,这俩服务都是挂着的,我换了个机器,用原来的yaml deploy时不能带上那个挂了的机器(否则报ssh错误),如果不带那个机器的话,现在的拓扑就没有那个节点,但实际运行的pd还是会去连那个节点,我想强制缩容了那个节点,就会报那个节点不在该拓扑中,这个应该怎么弄,影响倒是不大,因为已经可以扩容了,就是强迫症想把坏节点缩了

pd 只能用 pd-ctl member delete 命令删除这个节点了(tidb- server 应该不用管)(建议你把 tiup 和 数据库 分开来想,tiup 只是咱们集群的管理工具)

好嘞,明白,我试下,谢谢老师