升级 tidb 后OOM 延续讨论

升级 tidb 后OOM(4.0 -> 5.3.1) 继续讨论:

主要是跑着一直也正常,是突然出现的

之前按照说法已经将version改为1,而且删除统计信息了
https://docs.pingcap.com/zh/tidb/stable/statistics#统计信息简介

现在的情况是什么呢?

上次根据帖子里面所说的version改为1之后,跑了一段时间还是OOM,所以有点搞不懂,已经是半放弃状态了,想上来求知一下

那么高的cop task,检查下那段时间的大数据量SQL

查下 慢 SQL,或者 大事务的 SQL ,定位一下…

看看是哪些操作导致了 OOM

故障时间段的报告

按内存的排序有吗

看起来是没有的,我们业务没有order by类型的语句

可以看下 CLUSTER_STATEMENTS_SUMMARY_HISTORY或CLUSTER_SLOW_QUERY 按MAX_MEM sum 看下OOM前那段时间占内存较高的SQL。

可以拿到 OOM 前的 heap profile 信息吗,在 log 里搜 “tidb-server has the risk of OOM. Running SQLs and heap profile will be recorded in record path”

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。