tidb和tikv大量的报错，外部表现为tidb重启，连接丢失等。

rickywu · 2020 年9 月 10 日 07:41

为提高效率，提问时请提供以下信息，问题描述清晰可优先响应。

yilong · 2020 年9 月 10 日 09:11

rickywu · 2020 年9 月 10 日 09:33

没有oom日志，但确实都异常重启了

rickywu · 2020 年9 月 10 日 09:34

是否有什么关键字方便提供，我们再查一次

rickywu · 2020 年9 月 10 日 10:03

我们升级了db节点的配置到32core64g内存后好了一段时间，然后现在又有2个db节点down掉了。

请问这种问题如何排查。

yilong · 2020 年9 月 10 日 11:01

操作系统message日志中，可以查看 tidb 重启的时间点是否有 OOM kill 进程的信息
如果内存持续增长，可以查看 dashboard 界面，是否有 sql 消耗了大量内存
采集内存占用很多时的火焰图信息，可以多反馈几个profile信息，多谢。
curl -G “ip:port/debug/pprof/heap?seconds=30” > heap.profile 内存
ip地址为tidb服务器的ip，端口为tidb_status_port的端口