tidb内存突增导致oom

林先森cC · 2021 年10 月 19 日 06:28

TiDB_2021-10-19T06_21_48.710Z.json (5.5 MB) TiKV-Details_2021-10-19T06_15_11.656Z.json (25.3 MB) Overview_2021-10-19T06_06_03.979Z.json (2.8 MB)
您好这个是您需要的监控信息大概15号的23:03分内存开始飙升后面23点30多分重启了下tidb节点恢复了正常

林先森cC · 2021 年10 月 19 日 06:32

您好 tidb_mem_quota_query这个参数我看默认是1G 看了下tidb dashboard 的sql面板慢sql最高100多M 感觉应该不是这个原因

h5n1 · 2021 年10 月 19 日 07:14

看监控感觉像是跟GC有关，根本原因还得等大神来看

林先森cC · 2021 年10 月 19 日 07:44

TiDB_2021-10-19T06_21_48.710Z.json (5.5 MB) TiKV-Details_2021-10-19T06_15_11.656Z.json (25.3 MB) Overview_2021-10-19T06_06_03.979Z.json (2.8 MB) 您好这个是监控的快照大概15号的23:03分内存开始飙升后面23点30多分重启了下tidb节点恢复了正常

songxuecheng · 2021 年10 月 19 日 07:51

问题点的tidb前后日志发一下

林先森cC · 2021 年10 月 19 日 08:30

tidb.log (25.1 KB) 您好这个是tidb日志

songxuecheng · 2021 年10 月 19 日 08:39

这是全部的日志？

songxuecheng · 2021 年10 月 19 日 08:51

tiup cluster 看下拓扑，你这个是混合部署？

林先森cC · 2021 年10 月 19 日 09:02

10-12是部署TiDB，PD 各三节点 10是tiup中控机 12上还有prometheus Grafana Alertmanager 13-15是部署tikv

林先森cC · 2021 年10 月 19 日 09:06

tidb_1015.log (7.3 MB) 这份是当天的完整日志请查收差不多在2021/10/15 23:03 内存开始突增 [2021-10-15 23:15:57]收到TiDB_monitor_keep_alive,TiDB monitor_keep_alive error] 告警。23点33分左右重启tidb 恢复正常

yilong · 2021 年10 月 19 日 10:13

这个目录下记录的profile 文件还有吗？

林先森cC · 2021 年10 月 20 日 01:42

您好在的 record.tar.gz (19.8 MB)

yilong · 2021 年10 月 20 日 08:06

当时有什么特殊的操作吗？除了正常的业务访问？
看 profile 信息，主要消耗在 serveHTTP，但是看sql top 10 的信息，最多只占用了992 bytes，我们先分析下，多谢。

image572×952 136 KB

林先森cC · 2021 年10 月 22 日 02:40

没有别的特殊操作的一个集群是有定时的load导数据任务一个集群是高并发的读表

yilong · 2021 年10 月 22 日 03:13

起来像是 ddlHistoryJobHandler.ServeHTTP 这个地方导致的内存暴增是不是应用端拉了全量的 ddl history, 如果 ddl 很多的话且有并法的话, 确实会有这个问题，麻烦帮忙确认下，多谢。

林先森cC · 2021 年10 月 22 日 03:45

好的我们确认下感谢

haizi · 2021 年10 月 22 日 06:08

现在每天ddl不多的，就几个表同步数据的时候，会删表建表。看了information_scheam.ddl_jobs表，这个表也才14700条记录。

林先森cC · 2021 年10 月 22 日 06:11

您好应用的权限只有对库的增删改查呢这个全量的 ddl history 应该是没有权限拉

yilong · 2021 年10 月 22 日 06:41

是否有类似操作？如果有 25 的操作，建议使用 26 limit 限制。
https://github.com/pingcap/tidb/blob/master/docs/tidb_http_api.md

林先森cC · 2021 年10 月 22 日 08:08

您好我问了下没做过这种操作的

tidb内存突增 导致oom

tidb内存突增导致oom