升级到V4.0.4后CPU波动很大

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】:V4.0.4
  • 【问题描述】:9月17日晚11点升级TiDB到V4.0.4后,最近一周观察Grafana System Info指标,发现CPU Usage波动很大,比升级前版本V3.0.3差别巨大,想请教下需要提供哪些信息,帮忙分析。

若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出打印结果,请务必全选并复制粘贴上传。

  1. 麻烦反馈下完整的 over-view ,tidb ,detail-tikv 的监控
  2. 从监控看主要是tidb-server,还是 tikv-server ?

主要是TiDB Server压力大
Tidb-Aliprod-Overview_2020-09-24T10_15_25.181Z.json (5.6 MB)

Tidb-Aliprod-TiDB_2020-09-24T10_22_47.285Z.json (6.9 MB)

TiKV-detail 附件太大,详见百度分享链接: 百度网盘-链接不存在 密码: aped

从监控看, cpu 占用并没有太大的区别,都在25%附件。
image

考虑到上传文件大小问题,只上传了9.17~9.19号之间的指标数据,其他指标有明显的升高,如Network Traffic、IO Util。

我这边上传下这两天的指标,CPU、IO波动就明显了
Tidb-Aliprod-Overview_2020-09-24T12_58_05.263Z.json (8.9 MB)

  1. 您的机型都不一样, 248 只有 4核,所以看起来 cpu 消耗会比其他机器多。

  2. 196 在24号 8点多 cpu 占用较多,但是能看到,这个时间段负载相对较高

  3. 建议使用相同的机型,资源会更加均衡。