TiDB Server经常出现OOM,这种性能分析详情如何看

【 TiDB 使用环境】生产环境
【 TiDB 版本】7.5.2
【遇到的问题:问题现象及影响】

TiDB Server经常出现OOM,使用这个TiDB Dashboard-实例性能分析,出现了结果,但是这种图不知道如何看?大佬们,有详细的解析文档推荐吗

tidb oom就分析sql就行了,找到当时的大sql就行,https://docs.pingcap.com/zh/tidb/v7.5/tidb-troubleshooting-map#32-oom-问题
你看火焰图,他顶多告诉你主要集中在executor.(*IndexLookupJoin).startWorkers和executor.(*ProjectionExec).unParallelExecute这些函数上,还是得优化对应的sql

1 个赞

分析慢查询就好了,这个看不懂 :joy:

好的,感谢

dashboard的日志查询里搜一下 expensive query

image
https://docs.pingcap.com/zh/tidb/stable/identify-expensive-queries#定位消耗系统资源多的查询

1 个赞

大概率都是慢sql造成的

直接过滤慢语句。这个图公司没人懂,我们从来不看 :joy:

看一下top sql

还是分析慢sql吧,我也看不懂这个。

这个是sql语句 写的太菜有关系, 优化sql 优化 索引,

看下top sql吧,特别是有group by, distinct, join, union等执行慢的sql

有慢查询先查慢查询,没有慢查询再看这个。

看这个图得要点,我感觉你大概知道,就是直接往下看大平顶,就像你截图这样看。

最下层的大平顶就意味着这个环节用掉得资源最多。

整体看,你这个图是是某一个sql做了一个多表关联的top n或者是limit。
都用上了索引,执行计划应该问题不大,单纯就是扫描的数据量大了。
具体查查慢查询里面有没有类似的sql。