升级到4.0后,IO的使用率明显 提升。

昨天线上生产升级到4.0。现在IO由原先的25%一下生到75%以上。这个是因为什么导致的?

1赞

您好:

     1. 请问是从哪个版本升级到4.0的?
     2. 昨晚是否有大的跑批
     3. 请问QPS其他指标是否也有提升,麻烦发送overview,tidb,detail-tikv,disk-performance的监控,多谢. 

(1)、chrome 安装这个插件https://chrome.google.com/webstore/detail/full-page-screen-capture/fdpohaocaechififmbbbbbknoalclacl

(2)、鼠标焦点置于 Dashboard 上,按 ?可显示所有快捷键,先按 d 再按 E 可将所有 Rows 的 Panels 打开,需等待一段时间待页面加载完成。

(3)、使用这个 full-page-screen-capture 插件进行截屏保存

1.从2.1.6->v3.0.12->4.0RC。 2. overview:

TIDB,一直超时,只能发rar了。 screencapture-10-223-0-159-3000-d-000000005-cdel-tidb-223-cluster-tidb-2020-04-15-10_56_14.rar (4.5 MB)

tikv-detail 这个需要看啥,传不上去。需要看那些内容,我给你具体的截吧。

disk-performance

感谢,正在分析,多谢

非常感谢大神的帮忙,在升级版本的时候,一些参数没有优化导致IO使用率高。

[问题澄清] 集群版本:4.0rc 问题描述:3.0升级到4.0后IO升高

[问题分析] 1.查看IO监控,升级后IO增高

2. 查看compaction监控,compaction频繁 3. 查看升级前balance 4. 查看升级后balance 5. 调整balance参数: 将 balance 的 tolerance-ratio 改为0 自动调降低了 balance 的速度 将 hot region 的 src-tolerance-ratio, dst-tolerance-ratio 调成1.1 让 hot region 没那么敏感 。 观察一段时间后调度降了下来io也降下来。