dumpling备份报 Error 9005: Region is unavailable

集群是6台机器,8C16G14TSSD ,pd, tidb,tikv,监控都是部署在6台机器上面没分开,备份时只开了4个线程进行备份,记录最大5000行,文件大小128M。 --filetype sql -t 4 -B XXXX -r 5000 -F 128MB

我的意思是,观察一下拉高负载时,是否会对 region(leader)产生影响,如果有掉地的情况请控制下并发和吞吐

看下副本数是否为 3 (如果您的副本数是 3 副本的话)
region --jq=“.regions[] | {id: .id, peer_stores: [.peers[].store_id] | select(length < 3)}”

工具你可以在tiup控制机上执行 tiup ctl:v7.5.0 tikv 然后在/root/.tiup/components/ctl/v7.5.0目录下找到tikv-ctl,把这个工具拷贝到对应的kv节点上就能运行了

tikv-ctl没这个命令。

./tikv-ctl

这个不错

昨天就找了,还是没有这命令

在tiup控制机上执行 tiup ctl:v7.5.0 tikv 安装tikv-ctl 然后在/root/.tiup/components/ctl/v7.5.0目录下找到tikv-ctl,把这个工具拷贝到对应的kv节点上就能运行了

执行报错

版本不一样参数也不一样,把–db 改成–data-dir

试过了也一样报错

tidb 经常oom,有没有参数能够控制tidb内存,这个和region不可用,有没有直接关联呢

参考一下这个 https://docs.pingcap.com/zh/tidb/stable/configure-memory-usage#tidb-server-内存占用过高时的报警

能是由于 TiDB 集群中的某个 Region 不可用导致

看到这个配置,出现region不可用或者oom就说得过去了 :rofl:

限制不住,还有是可能oom

看下 grafana 监控吧。像是压力太大了导致的,把 topsql 分析分析。

tikv detail> thread cpu > unified read pool 看下tikv是不是过忙了,如果资源不够,tikv很忙,是会出现这个报错的。

负载太高了吧