tikv集群重启后-oom起不来

【 TiDB 使用环境】生产环境
【 TiDB 版本】TiDB-v3.0.16
【复现路径】集群重启后tikv节点起不来一直oom被kill
【遇到的问题:问题现象及影响】
系统报错日志:

tikv日志:

看看集群中tikv的资源利用率呢

这得等官方了tikv oom 都是bug

利用率不高 扩了内存了也不行

比我的3.1.0还老的版本,如果只有这个节点启动不了,是不是可以考虑,扩容新节点,缩容这个节点的方式处理掉这个问题呢

太老了,考虑下升级吧

升级这个口吻很官方,哈哈

没办法啊 ,3.0的版本文档都找到不到。爱莫能助

文档地址,拿去不谢 :joy_cat:

就准备这么搞了

我们的目的是解决问题,不是揪着问题不放,哈哈


这个有办法解决么

我这安装v3.1.0在安装文件配置的,不知道你这个版本是否可以这样配置
storage.block-cache.capacity: 15G
image

先加内存看看 会不会oom

看环境吧,是不是混合部署?blockcache设置的大小是多少?本身服务器内存是多少?
一般tikv默认情况下很少会出现OOM现象,有可能你服务器上有其他程序占用内存,导致服务器内存达到限制的情况下kill掉了tikv

扩了内存没有用,本来内存使用率在16G左右,后集群故障重启了,启动tikv的时候,tikv一直打满内存oom导致被kill

人家问你是不是混合部署 tikv 和tidb 部署在一台机器上

cgroup限制一下呢?之前有试过么

如果内存足够的情况下,还是oom,再看第二图的权限。还是不行的话,缩容再扩容吧。

版本比我们的还老