5.4OOM问题频发,新版本有没有这方面的优化


查询这里显示的是90G

设置低一点,56G就行,tikv最多能占到这个参数的2.3倍的内存。你设置90G,最多能占到200G了,tidb-server如果内存在占用多一点,tikv可不重启了吗?
另外其他的上面其他的建议也可以参考一下

tikv的内存波动不大,但是内存占用很多,tidb内存波动大,是不是操作系统因为内存不足,找了一个内存最大的就kill了。分开部署,或者用cgroup把tidb和tikv隔离开。

在测试环境中,改成具体G了,日志里打印的 memory limit in bytes:还是物理机的内存大小,不知道这个限制是不是生效了

升级新版了

先调整配置暂时避免OOM,最终的解决方案还是升级到新版。

升到6.x稳定试试吧

高版本已经优化了,升级到7的稳定版本即可

少了,但还有,还是查SQL

升级,6.5以上新版本控制的好

现在线上就用的5.4的。也还好。只是ddl太慢了。有几个表都要半个小时以上。 :innocent:

为什么会占到这个参数的2-3倍内存?

升级,6.5以上

这个只是tikv用来缓存数据的,你可以类似oracle的buffer cache,tikv还有很多其他组件需要使用内存啊。。。


6.5,日志这里,显示的也不是,限制后的内存大小

怎么调整,配置限制的内存大小是90G

升到6.5.x稳定试试

升级6.5以上吧



被kill时,其中一个node耗尽,另一个没有,这是什么情况?系统内存并没有完全耗尽

5.4的版本。对内存使用限制,管理有限。如果要调整,就调整下单个sql消耗的内存和block-cache.capacity。6.5的版本有memory-usage-limit。可以限制tikv实例内存使用。而且online ddl增强很明显。建议升级。我就是准备从5.4升级到6.5的,6.5的现在线上已经在测试了。测完就切换到新集群。