刚才尝试升级,启动过程中pd-leader持续load region,且包含一些load retry操作。3个多小时都没完,使用旧的pd bin文件回退后,集群状态正常了,但是所有账号好像都丢了…root都登不了
补充:
用户丢失是版本问题,手动把tidb的bin拷贝回去覆盖掉升级失败时的4.0.16版本重启就可以了。
集群算是恢复了,但是升级是个老大难问题了
之前从3.0.19升级过很多次4.0版本,数据量有大有小,有比这个更大的,从未发现这个load region的问题,感觉是个例,非普遍现象。