tidb-server oom

【 TiDB 使用环境】生产环境
【 TiDB 版本】
【复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】

https://docs.pingcap.com/zh/tidb/stable/troubleshoot-tidb-oom#tidb-oom-故障排查

报有oom风险时,临时文件中没有记录任何的sql.



这个时间的sql 执行也不多。

没记录就麻烦了。。。。。。

可以看看 tidb.log 里面 expensive 关键字的相关 SQL。看看能不能发现什么。

机器配置什么的信息有吗

也没有记录。

2台8C16G 的虚拟机,单独运行tidb-server。

应该不是这个 SQL。expensive 触发逻辑有两个,一个是超过 1g 的,一个是执行超过 1min 的。看看有没有其他的 SQL。

没有, 在oom 发生前没有找到其它的sql了。

感觉可能是 bug。。。要不试试升级呢。

安装dashboard监控没,到日志菜单列表中搜索一下tidb的相关日志信息,看下oom发生时间附近有没有相关sql报错

一般是不合理的语句引起的。看日志,explain analyze 语句呢

你这个TiDB Server也不是突然涨上去的,监控看内存没有突然暴增啊,你是混合部署吗?

我见过 tidb 内存飙升 oom 的,tikv oom 的感觉是混布情况,dashboard里面 host 的记录的是主机的内存,不是针对 tidb 的监控

oom 发生前都没有错误日志。截图中的错误日志都在在重启的过程中了

不是混部的。tidb-server 单独部署的。

你这个 tidb-server 看一下 panic 的日志,这个内存是直接往下掉的,也有可能是出现了 panic 吧。

没有panic 是被系统oom了。

可以看一下dashboard 流量可视化分析图
https://docs.pingcap.com/zh/tidb/stable/dashboard-key-visualizer

那就是太快了,都来不及记录就down了,你这 6.1 可以把topsql打开,这样down了,topsql还是有记录的。

2 个赞