tiup中某个集群元信息丢失,怎么手动补,可以有什么方式快速生成吗
丢失指 storage/cluster/clusters 下面的文件没了?
是的,下面文件都没了
目前没有太好的“快速恢复办法”,基本都是需要手动重建 topo 文件。可以参考 asktug 的一些链接,比如 意外情况 - 主控机程序丢失,.tiup 目录被删除并无法恢复 - TiDB 的问答社区 (asktug.com)、 [FAQ] .tiup 等元信息被删除恢复办法 - TiDB 的问答社区 (asktug.com)
如果你有集群的定期备份,那么从备份中恢复元信息可能是一个快速且安全的方法。
除了备份 没啥快速方法
夯筑耐心
定期备份吧
定期备份的重要性啊
好的 我看看 感谢
如果是多数节点都正常,可以自动恢复;如果损坏的节点超过半数,就要用备份了。
我们把tiup的信息,部署完后会同步内容到pd的3个节点,这样就安全多了,
在备节点安装tiup,然后配置原来集群的信息,topology.yaml (需要将原来集群节点的信息都录入, ip、port、配置、label都要和原来一样,
可以登陆每台机器查看一下,参数最好也都保持一致,否则后面可能还需要重新修改部分参数)
然后执行
tiup cluster deploy tidb-xxx ./topology.yaml
tiup cluster display tidb-xxx
可以看到原来的节点信息
我们一般会用 tiup cluster meta backup 定期备份一下tiup的数据,然后还原到另一个tiup中,查看两边信息是否一致,留一个备用的,以防主用的tiup出现问题,导致无法操作集群。
目前按这个方式,通过监控以及pd-ctl等方式确认组件元数据以及配置,重写了集群配置文件,重写了tiup源信息,感谢大佬
嗯嗯 现在准备备份到s3
虽然最终恢复了,但还是通过这个事情,说明了集群meta文件备份的重要性,备份存放在非中控主机
建议在中控机上不定期执行命令备份下:
tiup cluster meta backup 集群名 --file /data/tidb-backup/
此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。