有些硬盘IO使用率长期保持在90%以上,有碰到过?
当前做过什么操作,慢SQL看一下,是不是周末统计类sql多
我现在转移tikv,下线tikv一直是下线中,快2个小时了还没下线完,不知道怎么回事
检查业务是否有批量操作
按总执行时间倒序排序看看。也可能是tikv下线导致的。
1 个赞
业务没影响就等着
之前就是IO很高,现在下线3个tikv ,执行下线命令是成功的,但是下线很久了,还是下线中,看日志有:
[2024/03/09 21:45:30.574 +08:00] [INFO] [advance.rs:296] [“check leader failed”] [to_store=183] [error=“"[rpc failed] RpcFailure: 12-UNIMPLEMENTED"”] ,不知是否这个原因。
图中超过90%的三个是同一台机器上部署了三个TiKV实例吗?
是不是regin分布不均匀导致的
是 的
9个tikv对应3台机IO都是超过90%
Region没有配置过,默认的
硬盘是HDD的吗
不是,遗憾就是没有装固态硬盘
等完成下线TiKV节点再看看,如果业务量不大,也没什么慢SQL,关注下是否磁盘有问题。
该下线的tikv已经下线,我均匀了下tikv,现在IO已经降到85%上下波动
手工测试下盘的io
没有装固态硬盘 跑数据库100%正常
1 个赞
Grafana的Tidb-Cluster-Node_exporter下Disk下面的磁盘读写延迟看下,看下磁盘性能如何,比如写入延迟一般在3ms以内比较好