有机器先扩容多一个tiflash 节点
如果是剔除不了节点,就是你现在还有同步任务,数据量不大就把加速加速设置为0在剔除,数据量大看下文档to flash 扩缩容记得有删除pd 同步任务的说明试试
感谢,我先将5那个节点下掉了,prune删除,新扩了一台。明天再请各位大佬帮看一下,其它节点也有core文件,和这台机器启不来的原因。
感觉有点像虚拟化报错 你这在腾讯云上吧
机器是腾讯云S6型号Intel Ice Lake(2.7GHz/3.3GHz)。16C/32GB内存
这是高手,腾讯云都能看出来。
生产环境的话还是先扩一台撑一阵比较好,反正虚机很快。
有时间再看下监控上的内存占用。
感觉象是配置参数上有问题
先扩容再排查问题呀
我也感觉 像是tiflash上哪个内存参数配大了还是怎么的?我过会把config全贴上来
日志应该还没截到那个实际问题的日志
先扩容,再下节点
export_result (4).csv (321.1 KB)
1、我发现其它flash机器的安装目录下也有大量core文件产生。用gdb工具分析报
Python Exception <class ‘gdb.MemoryError’> Cannot access memory at address 0x7fa7843a4818:
#0 0x00000000070db9de in ?? ()
Cannot access memory at address 0x7fa7843a4818
2、我将config文件上传,大佬们帮忙分析一下。感谢感谢
3、监控发现内存确实有大的波动
大佬 我上传了配置,帮分析下是哪个参数配错了
tiflash使用c++写的。 Cannot access memory at address 0x7fa7843a4818这个报错是c++堆栈空间溢出了,应该是个BUG.
您从我的配置文件上看,是不是我哪个参数配的有问题?
统一回复一下大家:此问题已解决。
解决方案:升配32C 128GB未再有oom发生
是突然数据量大了之后内存不够用了么
此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。