【 TiDB 使用环境】生产环境
【 TiDB 版本】TiDB-v3.0.16
【复现路径】集群重启后tikv节点起不来一直oom被kill
【遇到的问题:问题现象及影响】
系统报错日志:
tikv日志:
【 TiDB 使用环境】生产环境
【 TiDB 版本】TiDB-v3.0.16
【复现路径】集群重启后tikv节点起不来一直oom被kill
【遇到的问题:问题现象及影响】
系统报错日志:
tikv日志:
看看集群中tikv的资源利用率呢
这得等官方了tikv oom 都是bug
利用率不高 扩了内存了也不行
比我的3.1.0还老的版本,如果只有这个节点启动不了,是不是可以考虑,扩容新节点,缩容这个节点的方式处理掉这个问题呢
太老了,考虑下升级吧
升级这个口吻很官方,哈哈
没办法啊 ,3.0的版本文档都找到不到。爱莫能助
文档地址,拿去不谢
就准备这么搞了
我们的目的是解决问题,不是揪着问题不放,哈哈
我这安装v3.1.0在安装文件配置的,不知道你这个版本是否可以这样配置
storage.block-cache.capacity: 15G
先加内存看看 会不会oom
看环境吧,是不是混合部署?blockcache设置的大小是多少?本身服务器内存是多少?
一般tikv默认情况下很少会出现OOM现象,有可能你服务器上有其他程序占用内存,导致服务器内存达到限制的情况下kill掉了tikv
扩了内存没有用,本来内存使用率在16G左右,后集群故障重启了,启动tikv的时候,tikv一直打满内存oom导致被kill
人家问你是不是混合部署 tikv 和tidb 部署在一台机器上
cgroup限制一下呢?之前有试过么
如果内存足够的情况下,还是oom,再看第二图的权限。还是不行的话,缩容再扩容吧。
版本比我们的还老