TiDB 的问答社区

tikv oom如何定位是哪条语句

🪐 TiDB 技术问题

Jolyne 2023 年7 月 28 日 01:58 1

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】
【复现路径】做过哪些操作出现的问题
tikv的内存和cpu在凌晨突然飙升，导致一台tikvoom重启了，通过dashbord面板查看改时间段并没有什么大sql在执行，其他的一些监控指标也没有异常，想问下大家在这种情况下如何定位的（blockcache设置的是48G，我看官网说6.6以后这个弃用了）
【遇到的问题：问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件：截图/日志/监控】

Kongdom (Kongdom) 2023 年7 月 28 日 02:02 2

tidb日志中有 EXPENSIVE_QUERY么？

caiyfc 2023 年7 月 28 日 02:04 3

你要查慢sql，或者楼上说的EXPENSIVE关键字。你可以自己看看语句分析相关说明，查不到sql的情况是有可能的

Jolyne 2023 年7 月 28 日 02:07 4

没有这个

Kongdom (Kongdom) 2023 年7 月 28 日 02:07 5

还有一种情况，这个语句在INFORMATION_SCHEMA.CLUSTER_PROCESSLIST里。
慢查询只会记录执行完成的sql。

Kongdom (Kongdom) 2023 年7 月 28 日 02:09 6

看这个图不像OOM吧，感觉是重启了，OOM应该是一条斜线，看监控直接就是直上直下的。

caiyfc 2023 年7 月 28 日 02:11 7

慢查询会记录未完成的sql，之前oom，我都是到慢查询看执行计划的，sql页还有是否执行成功的显示，显示的是0

Jolyne 2023 年7 月 28 日 02:13 8

是oom了，被kill掉了

Jolyne 2023 年7 月 28 日 02:15 9

我看都是内部分析sql，这个也是一部分因素？

caiyfc 2023 年7 月 28 日 02:22 10

看起来都不像。可以根据官网的方案先检测一下：

还可以参考这个文章：
专栏 - TiKV主要内存结构和OOM排查总结 | TiDB 社区

Jolyne 2023 年7 月 28 日 02:40 11

监控我都看了，好像都没啥问题，但是我看这几个监控异常的高，

还有个疑惑，我block-cache是不是设置的过高，我64G内存，设置了48Gcache

caiyfc 2023 年7 月 28 日 02:47 12

64G内存，设置了48G，有点高。我一般设置60%。
看监控，tikv内存是突然增高的，最好能查到原因，但是根据其他监控，好像也没啥异常，你发的这几个监控，在5.30的时候都不是很高。

裤衩儿飞上天 2023 年7 月 28 日 02:51 13

调查下，那个时间段有没有定时任务再跑，比如备份，跑批；
业务在前一天有没有升级，变更

Jolyne 2023 年7 月 28 日 02:53 14

我之前设置的是40G，但是一天之后看监控的block-cache-size就超出了40g达到48G左右

tidb菜鸟一只 (小菜一颗) 2023 年7 月 28 日 03:33 15

SHOW config WHERE NAME LIKE ‘storage.block-cache.capacity’
这个参数设置的多少？

tidb狂热爱好者 2023 年7 月 28 日 04:02 16

你这图里排第一个的sql单个500m 执行十几个这不就是原因吗 oom是大家用缓存先把最大的sql优化了

Jolyne 2023 年7 月 28 日 05:37 17

原来设置的是48G，刚刚改成了38G，不过好像与这个无关，只是之前看到哪篇帖子说设置成内存的75%左右的。

tidb菜鸟一只 (小菜一颗) 2023 年7 月 28 日 06:26 18

tikv没有混部的话，这个值设置为机器内存的45%就行，这个用来缓存数据的，光它占75%的话，oom很正常。。。

Jolyne 2023 年7 月 28 日 06:29 19

好的谢谢，可能我之前看错了。

tidb狂热爱好者 2023 年7 月 29 日 09:48 20

大佬真的超级无敌
tidb的调参数最好别调默认就很好了

©2023 TiDB Community. 京ICP备20022552号-5 京公网安备11010802043344号