每天特定时间段SQL执行时间异常慢 ,是什么原因导致

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】:v4.0.7
  • 【问题描述】:开发反馈12-09 18:00 左右的SQL异常慢 ,是什么原因导致

相关排查信息

查看监控面板发现有慢SQL ,如图

这时间段的 PD TSO Wait Duration 长,

查看这段时间的慢SQL大部分都是业务SQL,如图:

查看每天这个时间段都有这种情况

抽查了几个都是SQL执行的各个步骤都正常,但最后的 SQL 执行时间 特别长 如图

生成一个 集群诊断, 发现tidb_query.internal 耗时特别长,

若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出打印结果,请务必全选并复制粘贴上传。

1、请确认下 slowlog 中的 sql 本身的执行计划是否出现偏差,比如从 index scan 变成了 table scan。

2、sql 的执行计划本身没有问题的情况下,每天会在特定的时间段 18:00 左右都会出现慢的情况吗?这个时间段是业务在跑批吗?

3、请检查出现慢 sql 的时间段内 tidb server 以及 pd server (pd leader)的网络,cpu,服务器 load 情况,监控信息可以从 grafana 监控 node-exporter dashboard 获取

已经排查出来 是网络问题 导致

:+1:t2::+1:t2::+1:t2: