查询系统表PROCESSLIST发现很多update和commit操作的mem内存使用异常的大

顾刚-数据 · 2023 年12 月 23 日 07:34

【 TiDB 使用环境】生产环境
【 TiDB 版本】v4.0.0
【复现路径】对表数据进行update操作
【遇到的问题：问题现象及影响】系统表PROCESSLIST发现很多update和commit操作的mem内存使用异常的大，然后两个tibd节点的cpu使用率达到90%以上，整个集群连接异常，简单地查询速度极慢

【资源配置】30台服务器的一个tidb集群

图中的xxl_job表实际就两条数据，理论上update修改数据不会消耗这么大的内存

zhanggame1 · 2023 年12 月 23 日 07:48

这个mem列没啥用，不要当做什么参考价值

小龙虾爱大龙虾 · 2023 年12 月 23 日 09:54

低版本bug，你服务器都没这么多内存。4.0太老了，升级吧

zhanggame1 · 2023 年12 月 23 日 11:54

高版本也这样的，别看这个值了

江湖故人 · 2023 年12 月 23 日 15:20

大佬们快往上反馈下，不是个例了

小龙虾爱大龙虾 · 2023 年12 月 24 日 02:27

提issue吧，把复现步骤贴上去

江湖故人 · 2023 年12 月 24 日 10:31

看着是个老问题，有人提过issue了
mem field in information_schema.processlist display abnormal · Issue #18588 · pingcap/tidb · GitHub

Jellybean · 2023 年12 月 24 日 11:29

Grafana 监控图和机器的内存使用量如何？

这个SQL语句的 explain 执行计划也麻烦贴一下，方便分析

dba远航 · 2023 年12 月 25 日 00:45

那个值一看就很假

andone · 2023 年12 月 25 日 05:17

没有参考价值，可以忽略

顾刚-数据 · 2023 年12 月 25 日 07:59

集群tidb两个节点cpu使用率都达90以上，jdbc连接tidb集群异常，后续这个mem异常的kill恢复后集群就正常了

顾刚-数据 · 2023 年12 月 25 日 08:00

集群tidb两个节点cpu使用率都达90以上，后台jdbc连接tidb集群异常，然后我查的系统表就发现了这个异常现象，后续这个mem异常的kill恢复后集群就正常了

顾刚-数据 · 2023 年12 月 25 日 08:03

对，整个集群也没这么多的内存的。但是集群状态当时异常了一两个小时，jdbc连接集群都连不上，简单查询也很慢很慢，然后查系统表查到这个mem异常问题的，这个mem异常问题恢复后，集群也跟着恢复了，所以想问问这个mem异常大是怎么导致的

顾刚-数据 · 2023 年12 月 25 日 08:05

集群tidb两个节点cpu使用率都达90以上，后台jdbc连接tidb集群异常，然后我查的系统表就发现了这个mem异常大的现象。意思这两者并没有关系？

连连看db · 2023 年12 月 25 日 08:34

升级吧，太老了

小龙虾爱大龙虾 · 2023 年12 月 25 日 09:55

+1 先升上来再说吧，这个版本已经太老了

Jellybean · 2023 年12 月 25 日 15:12

确认一下对应的SQL语句的 explain 执行计划，自己tidb日志

tidb菜鸟一只 · 2023 年12 月 26 日 07:30

这里面mem应该体现的是不是当前这个sql占用的内存量，而是你这个链接累计的内存占用量，你现在是一条update sql，但是可能前面是一个很大的查询sql，所以累计内存占用的多，但是这个不代表当前这个连接还占用内存很多。