数据库无法读取 “ERROR 9005 (HY000): Region is unavailable”

【 TiDB 使用环境】
9台16核 64G 500G (openstack 虚拟机)正迁移至 5台56核256G 1T SSD 物理机
【概述】场景+问题概述
现数据库查询显示“ERROR 9005 (HY000): Region is unavailable”
【背景】做过哪些操作
完成物理机tikv节点加入集群后,对虚拟机上的tikv节点进行缩容
【现象】业务和数据库现象
现数据库查询显示“ERROR 9005 (HY000): Region is unavailable”
【业务影响】
集群已无法正常读取数据
【TiDB 版本】
v4.0.13

1 个赞

缩容操作过程中是否顺利?有没有强制缩容?
tiup cluster display 查看一下集群状态。
查看一下监控中关于 region 的监控信息

现在还在缩容中,没有强制缩容



从 region数量走势来看,vm的region正慢慢转移到 物理机上,稍等一会吧,数据量有点大。

但是现在的状态是数据库不可查询了,这个是线上库
从region曲线看,至少还要明天晚上才能全部迁移完成,如果不可查询状态要持续1天多,基本无法接受。

你的原始目的是将vm上的所有数据都迁移到物理机上,迁移数据用dm,或者备份还原都行啊。
通过tikv的扩缩容来迁移数据确实不是最佳实践

另外两种方式都需要停前面的服务或者停止服务写入
考虑到扩缩容方式能支持在线迁移,所以考虑使用的
有办法暂停正在进行的scale-in操作吗?可以考虑1个节点1个节点的缩容
昨天下午先缩容4个节点时,集群读取都是正常的,想减少同步进行的节点数

我知道你的意思了,就是数据库不能变,即使dm可以全量迁移,但是最后还是要停服务切库。

但是终止scale-in 很危险,慎用。

是的。
终止scale-in会有什么风险?

Hi,可以参考一下这个帖子哈,风险是有的,主要是数据调度导致业务请求超时风险。

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。