tidb数据库服务器宕机

【 TiDB 使用环境】测试
【 TiDB 版本】 6.5
【复现路径】执行某些sql,数据量级也不是很大,可能就在万级别
【遇到的问题:问题现象及影响】 服务器直接宕机,假死,然后回复
数据库集群三台机器混合部署的,配置不是很高,不知道是资源问题,还是=集群配置问题,导致数据库服务经常宕机

【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】

给你卜一卦看看 :smiley_cat:

大佬救命 :flushed:

看看TiDB Server、内存使用情况。dashboard检查下慢SQL

和我测试环境差不多,资源用尽卡死重启,盲猜慢sql太多了。让研发自己去看优化。

看下日志,是什么原因重启的,是内存不足被kill的吗,看看系统日志/var/log/messages

我就是研发,好多优化不了的 :joy:

内存使用率都差不多瓶颈了,oom 很正常,不会优化就加资源吧

内存参数限制了吗,如果你没配置限制混合部署一定会oom
主要配置有2个,tidb组件用
set global tidb_server_memory_limit=‘30%’;

tikv在tiup中配置
storage.block-cache.capacity: 8GB

改成这样试试

嗯嗯,是准备加资源的,主要是想找下原因

把高峰时期的慢查询贴出来看看

看配置应该是默认80%,尝试改成30试试

storage.block-cache.capacity也得设置,要不一定会oom

好的,谢谢大佬

系统跑起来去看看几个组件占用内存的监控,top命令看就行

参数参考:
https://docs.pingcap.com/zh/tidb/stable/hybrid-deployment-topology#混合部署的关键参数介绍

主要是要设置block-cache 就能很大程度避免OOM的问题

原因99%都是sql导致的,优化sql

把SQL粘出来看看,全表扫描的表,可以考虑加载到tiflash中。

oom了吧,把内存限制配置一下,还有就是得优化sql了

配置不高,混合部署。
资源没有限制配置。