prometheus 抓取监控数据的时候有日志记录吗？

逍遥_猫 · 2023 年12 月 1 日 09:37

版本v6.5.1
集群dashboard显示的抓取的内存和IO 有部分机器有异常，怎么能看到prometheus 抓取的日志？

逍遥_猫 · 2023 年12 月 1 日 09:39

看了tidb-deploy/prometheus-9091/log下的日志prometheus.log 只有早上7点的记录，从今天早上7点到现在这段时间一直没有日志记录，配置文件中log-level： info

芮芮是产品 · 2023 年12 月 1 日 09:41

那不坏了吗

逍遥_猫 · 2023 年12 月 1 日 09:42

集群pd\tidb\tikv等监控数据一直都有GET回来

Inkjade · 2023 年12 月 1 日 09:45

获取的日志在tidb-deploy/prometheus-9091/log
1.检查你的prometheus上，无日志接节点状态(UP)是否正常
2.如果不正常，检查agent状态(网络状态)
3.重启prometheus服务，观察是否正常

有猫万事足 · 2023 年12 月 1 日 09:51

访问这个地址

http://{prometheus_ip}:9091/targets

可以看到每个targets上次抓取的间隔，和抓取的耗时。
估计某几个targets已经不能正常工作了。
前面的url可以尝试访问一下，看是否能正常返回监控值。

dba远航 · 2023 年12 月 3 日 01:45

检查服务器跟其它服务器的通信情况，是不是抓取日志的问题

逍遥_猫 · 2023 年12 月 3 日 03:09

1、prometheus没抓取到数据的节点正常，无服务重启现象，内存最多使用到80%，CPU也有冗余，IO无异常
3、待改个参数试试重启

逍遥_猫 · 2023 年12 月 3 日 03:12

prometheus抓取其它机器监控数据正常
此机器与其它集群通信正常，无异常无告警，IO,CPU和内存资源使用也未到极致
不过当前机器跑的SQL 时间超长，异常

逍遥_猫 · 2023 年12 月 4 日 03:42

这个能看到上次的连接记录，怎么能看到历史的呢？

像风一样的男子 · 2023 年12 月 4 日 05:18

promethues 本身有一个时序数据库，数据会存数据库里

像风一样的男子 · 2023 年12 月 4 日 05:21

数据存储在tsdb中
/data/tidb-data/prometheus-8249
1701667270916

逍遥_猫 · 2023 年12 月 4 日 06:38

这个是采集到的监控数据
想看连接日志记录，握手那种的

逍遥_猫 · 2023 年12 月 4 日 06:41

这里

tidb使用内存怎么是0 呢？

逍遥_猫 · 2023 年12 月 4 日 07:02

类似这个/data/tidb/tidb-deploy/prometheus-9091/log

但是这个没记录被监控机器的ip

有猫万事足 · 2023 年12 月 4 日 07:57

历史的问题，确实不知道怎么看。
这种没有的，应该就是没有采集到数据。
那个时刻target调用应该是失败的。

像风一样的男子 · 2023 年12 月 4 日 10:34

这么详细的记录是没有的，开销太大

system · 2024 年2 月 2 日 10:35

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。

prometheus 抓取监控数据的时候 有日志记录吗？