prometheus 抓取监控数据的时候 有日志记录吗?

版本v6.5.1
集群dashboard显示的 抓取的内存和IO 有部分机器有异常,怎么能看到prometheus 抓取的日志?

看了tidb-deploy/prometheus-9091/log下的日志prometheus.log 只有早上7点的记录,从今天早上7点到现在这段时间一直没有日志记录,配置文件中log-level: info

那不坏了吗

集群pd\tidb\tikv等监控数据一直都有GET回来

获取的日志在tidb-deploy/prometheus-9091/log
1.检查你的prometheus上,无日志接节点状态(UP)是否正常
2.如果不正常,检查agent状态(网络状态)
3.重启prometheus服务,观察是否正常

1 个赞

访问这个地址

http://{prometheus_ip}:9091/targets

可以看到每个targets上次抓取的间隔,和抓取的耗时。
估计某几个targets已经不能正常工作了。
前面的url可以尝试访问一下,看是否能正常返回监控值。

1 个赞

检查服务器跟其它服务器的通信情况,是不是抓取日志的问题

1、prometheus没抓取到数据的节点正常,无服务重启现象,内存最多使用到80%,CPU也有冗余,IO无异常
3、待改个参数试试重启

prometheus抓取其它机器监控数据正常
此机器与其它集群通信正常,无异常无告警,IO,CPU和内存 资源使用也未到极致
不过当前机器跑的SQL 时间超长,异常

这个能看到上次的连接记录,怎么能看到历史的呢?

promethues 本身有一个时序数据库,数据会存数据库里

数据存储在tsdb中
/data/tidb-data/prometheus-8249
1701667270916

这个是采集到的监控数据
想看 连接日志记录,握手那种的

这里


tidb使用内存怎么是0 呢?

类似这个/data/tidb/tidb-deploy/prometheus-9091/log


但是这个没记录 被监控机器的ip

历史的问题,确实不知道怎么看。
这种没有的,应该就是没有采集到数据。
那个时刻target调用应该是失败的。

这么详细的记录是没有的,开销太大

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。