出现大量慢SQL 获取悲观锁时间长

为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:

【问题概述】 tidb内部的更新sql超时

执行计划:
id task estRows operator info actRows execution info memory disk
Update_2 root 0 N/A 0 time:2.866076013s, loops:1 0 Bytes N/A
└─Point_Get_1 root 1 table:stats_meta, index:tbl(table_id), lock 0 time:2.866068086s, loops:1, Get:{num_rpc:1, total_time:26.858798ms} N/A N/A

获取悲观锁的时间也比较长:

【TiDB 版本】 v4.0.8


若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

从监控看 95% scheduler command duration 持续在 2.0s 左右,dashboard 看到的更新 stats_meta 表的 slow query 是间歇性的,除了这部分 internal sql,还有其他业务 sql 锁等待执行慢吗

看着时间不像是间歇性的:


其他业务SQL也有这种情况:

select 查询不会拿悲观锁,应该跟这个无关,update 慢 SQL 可以导出一段时间的 slow query 看看

这是一个实例上的一部分日志:
slowsql.txt (28.8 KB)

  1. 看时间主要是 21:51 —21:53. 请问从全天来看,大量慢sql 出现的时间大概都是什么时候?
  2. 能否反馈下 grafana over-view, pd, tidb,detail-tikv 监控信息,多谢。
    [FAQ] Grafana Metrics 页面的导出和导入 导入导出参考