升级失败后,回退操作有问题请教

为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:

【TiDB 版本】
v4.0.10,v5.0.0-rc
【问题描述】
我一开始想要将v4.0.10升级到v5.0.0-rc,在网上下载了离线包:


执行sh local_install.sh后,执行升级操作:tiup cluster upgrade tidb-test v5.0.0-rc

我一开始以为是包的问题,于是直接将5.0.0-rc的包rm掉了,现在回到4.0.10下面执行sh也不行了:

那个我想问一下,
1、这个是不是因为已经将5.0.0-rc的安装包删除了,找不到tiup了,想要重新执行sh local_install.sh这个也不可以了?
2、要想重新恢复4.0.10的话,是不是要将.tiup目录删除,然后重新执行sh local_install.sh嘛?


若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

测试环境重装吧,一般也不建议降级。

嗯,好的,我ps -ef看了一下,pd等那些组件都还在,我想的是直接重新装一下tiup就可以了嘛?还是说要把集群组件都停掉,然后重新弄?
对了,我一开始升级失败,是因为5.0.0-rc的安装包有问题嘛?

大佬好,我重新下了个安装包,然后到对应的目录下解压后,重新到tidb-community-server-v4.0.10-linux-amd64这个目录下执行sh local_install.sh后,可以tiup可以了,下面我接着使用新下的tidb-community-server-v5.0.0-rc-linux-amd64的安装包升级,执行sh local_install.sh脚本是可以的,但是使用tiup有问题:
执行过rm -rf ~/.tiup/manifests后,还是一样的问题:
image
使用tiup update后,还是不行:

方便把环境清理干净了,重新都使用统一的版本吗? 这样不会有之前版本的干扰,毕竟您这边回退过。

哦,这个意思就是我先把集群删掉,然后使用v5.0.0的安装包部署是吗?

是的,这样就不会有残留的信息干扰。

哦,好的,谢谢,那如果是线上环境的话,出现这种情况怎么办呢:thinking:

线上应该会很仔细,也会找其他办法修复。不会随意用版本来替换,测试环境没必要,不如重装方便。

嗯,是的,我们这里TiDB已经提上日程了,让我模拟各种情况出问题,然后恢复,我想这个也是一种情况,想了解一下,如何更优雅的解决:slightly_smiling_face:

不用回退,在v5.0那一步想办法恢复就行了。

哦,好的,谢谢,那我这个已经回退了,就只有重新部署了,是吧

嗯嗯,测试环境就尽快重新部署吧。

好的,先谢谢了

:handshake:

大佬好,我今天尝试直接部署5.0.0,但是在第一步就出错了,我觉得这个是安装包的问题,是吗?:rofl:这个就是要重新下载包嘛?我来重新下个包试试看,很玄,这个在我们的物理机上人家部署过成功了,我直接拖过来的,难道拖得时候出问题了。。。?

copy包的时候,尽量使用scp,最好也可以校验一下checksum,看看copy过程中有没有损坏。别人能安装成功就没问题。

好的,谢谢

:handshake: