昨天线上生产升级到4.0。现在IO由原先的25%一下生到75%以上。这个是因为什么导致的?
1 个赞
您好:
1. 请问是从哪个版本升级到4.0的?
2. 昨晚是否有大的跑批
3. 请问QPS其他指标是否也有提升,麻烦发送overview,tidb,detail-tikv,disk-performance的监控,多谢.
(1)、chrome 安装这个插件https://chrome.google.com/webstore/detail/full-page-screen-capture/fdpohaocaechififmbbbbbknoalclacl
(2)、鼠标焦点置于 Dashboard 上,按 ?可显示所有快捷键,先按 d 再按 E 可将所有 Rows 的 Panels 打开,需等待一段时间待页面加载完成。
(3)、使用这个 full-page-screen-capture 插件进行截屏保存
TIDB,一直超时,只能发rar了。
screencapture-10-223-0-159-3000-d-000000005-cdel-tidb-223-cluster-tidb-2020-04-15-10_56_14.rar (4.5 MB)
tikv-detail 这个需要看啥,传不上去。需要看那些内容,我给你具体的截吧。
感谢,正在分析,多谢
非常感谢大神的帮忙,在升级版本的时候,一些参数没有优化导致IO使用率高。
[问题澄清]
集群版本:4.0rc
问题描述:3.0升级到4.0后IO升高
[问题分析]
1.查看IO监控,升级后IO增高
2. 查看compaction监控,compaction频繁
3. 查看升级前balance
4. 查看升级后balance
5. 调整balance参数:
将 balance 的 tolerance-ratio 改为0 自动调降低了 balance 的速度
将 hot region 的 src-tolerance-ratio, dst-tolerance-ratio 调成1.1 让 hot region 没那么敏感 。
观察一段时间后调度降了下来io也降下来。
此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。