promethues监控内存cpu异常增长

【 TiDB 使用环境】生产环境 /测试/ Poc
最近发现promethues的资源使用异常,cpu内存,文件打开数一直在上升

测试环境试试重启一下监控组件,看问题会不会重现

重启了promethues后,进程的内存cpu还是偏高。
image

把 dashboard 的 top sql 功能和持续分析功能先关掉看看,再不行就不要让 ng-monitor 启动了

2 个赞

重启下监控组建,看下。

promethues删掉数据后重启变正常了,可能最近监控数据太多了,15天有100多个g了。

注意promethues的targets页面里面是不是有些抓数据的接口,返回的时间特别长。

碰到过promethues反复oom的情况是因为pd反馈监控数据的接口调用一次时间巨长。放浏览器里面访问一下,输出的指标10s+都没结束。

因为这个接口返回了巨量的指标数据,导致promethues内存一直异常升高,反复重启。后来单独重启了这个pd解决了。因为不知道具体是怎么造成,我也没提issue。

和你描述的一摸一样返回的监控指标查询特别慢,但是我没重启pd,只是清了prometheus数据,重启prometheus后好了。

1 个赞

使用较新版本的Prometheus,可以利用TSDB的特性对数据进行分区存储

此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。