整个集群的DML操作变的非常缓慢,不知道什么原因

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】:V3.0.12
  • 【问题描述】:从8.13号开始,集群的所有DML操作都变换非常缓慢,截止到现在数据量大概在370G左右,分了五个库。

可否使用以下方式,提供下 tikv-detail / tidb 的监控面板截图。感谢配合:


打开 grafana 监控,先按 d 再按 shift+e 可以打开所有监控项。

(1)、chrome 安装这个插件https://chrome.google.com/webstore/detail/full-page-screen-capture/fdpohaocaechififmbbbbbknoalclacl

(2)、鼠标焦点置于 Dashboard 上,按 ?可显示所有快捷键,先按 d 再按 E 可将所有 Rows 的 Panels 打开,需等待一段时间待页面加载完成。

(3)、使用这个 full-page-screen-capture 插件进行截屏保存

pd-ctl store 的信息也反馈下

tikv-detail、tidb、pd信息文件地址:链接: https://pan.baidu.com/s/1FgNZkcY2aKPijtWKNIEqFw 密码: ab71

pd-ctl store pd-ctl store.MD (1.9 KB)

从 TIDB 监控看,主要延迟在 TiKV 请求,应该存在大量的下推请求,你可以尝试具体 SQL 性能优化的步骤,检查一下 slow log 的 query 的表统计信息是否准确,另外查看是否有大量的全表扫。我建议先整库收集统计信息,然后再观察一下情况。

https://docs.pingcap.com/zh/tidb/stable/statistics#统计信息简介

这边尝试查看下 slow log 的 query 的表统计信息

请问进展怎么样,有效果吗?

暂时还在处理慢查询语句,后续会发帖反映。

:smiley: