升级到4.0后,IO的使用率明显 提升。

昨天线上生产升级到4.0。现在IO由原先的25%一下生到75%以上。这个是因为什么导致的?

1 个赞

您好:

     1. 请问是从哪个版本升级到4.0的?
     2. 昨晚是否有大的跑批
     3. 请问QPS其他指标是否也有提升,麻烦发送overview,tidb,detail-tikv,disk-performance的监控,多谢. 

(1)、chrome 安装这个插件https://chrome.google.com/webstore/detail/full-page-screen-capture/fdpohaocaechififmbbbbbknoalclacl

(2)、鼠标焦点置于 Dashboard 上,按 ?可显示所有快捷键,先按 d 再按 E 可将所有 Rows 的 Panels 打开,需等待一段时间待页面加载完成。

(3)、使用这个 full-page-screen-capture 插件进行截屏保存

1.从2.1.6->v3.0.12->4.0RC。
2.
overview:

TIDB,一直超时,只能发rar了。
screencapture-10-223-0-159-3000-d-000000005-cdel-tidb-223-cluster-tidb-2020-04-15-10_56_14.rar (4.5 MB)

tikv-detail 这个需要看啥,传不上去。需要看那些内容,我给你具体的截吧。

disk-performance

感谢,正在分析,多谢

非常感谢大神的帮忙,在升级版本的时候,一些参数没有优化导致IO使用率高。

[问题澄清]
集群版本:4.0rc
问题描述:3.0升级到4.0后IO升高

[问题分析]
1.查看IO监控,升级后IO增高


2. 查看compaction监控,compaction频繁

3. 查看升级前balance

4. 查看升级后balance

5. 调整balance参数:
将 balance 的 tolerance-ratio 改为0 自动调降低了 balance 的速度
将 hot region 的 src-tolerance-ratio, dst-tolerance-ratio 调成1.1 让 hot region 没那么敏感 。
观察一段时间后调度降了下来io也降下来。

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。