集群是6台机器,8C16G14TSSD ,pd, tidb,tikv,监控都是部署在6台机器上面没分开,备份时只开了4个线程进行备份,记录最大5000行,文件大小128M。 --filetype sql -t 4 -B XXXX -r 5000 -F 128MB
我的意思是,观察一下拉高负载时,是否会对 region(leader)产生影响,如果有掉地的情况请控制下并发和吞吐
看下副本数是否为 3 (如果您的副本数是 3 副本的话)
region --jq=“.regions[] | {id: .id, peer_stores: [.peers[].store_id] | select(length < 3)}”
工具你可以在tiup控制机上执行 tiup ctl:v7.5.0 tikv 然后在/root/.tiup/components/ctl/v7.5.0目录下找到tikv-ctl,把这个工具拷贝到对应的kv节点上就能运行了
tikv-ctl没这个命令。
这个不错
在tiup控制机上执行 tiup ctl:v7.5.0 tikv 安装tikv-ctl 然后在/root/.tiup/components/ctl/v7.5.0目录下找到tikv-ctl,把这个工具拷贝到对应的kv节点上就能运行了
版本不一样参数也不一样,把–db 改成–data-dir
能是由于 TiDB 集群中的某个 Region 不可用导致
看到这个配置,出现region不可用或者oom就说得过去了
看下 grafana 监控吧。像是压力太大了导致的,把 topsql 分析分析。
tikv detail> thread cpu > unified read pool 看下tikv是不是过忙了,如果资源不够,tikv很忙,是会出现这个报错的。
负载太高了吧