为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:
【概述】 升级dm集群版本,从2.0.1升级为2.0.4后,任务信息正常显示,但是在binlog各个指标监控图表无信息展示。如下图,升级版本在11点之后。需要中没操作才能显示binlog同步信息呢
【现象】
【TiDB 版本】
【附件】
为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:
【概述】 升级dm集群版本,从2.0.1升级为2.0.4后,任务信息正常显示,但是在binlog各个指标监控图表无信息展示。如下图,升级版本在11点之后。需要中没操作才能显示binlog同步信息呢
【现象】
【TiDB 版本】
【附件】
grafana 监控无数据,建议按照:1、先查看 集群状态(或对应组件状态)是否正常(这个咱们以前确认了)2、登陆 promehteus 的页面(和登陆 grafana 一样,只是IP:PROT 要换成 prometheus 的,然后再执行框里,执行 grafana 里的表达式(表达式,可以在对应 grafana 监控指标的编辑模式里查看一个下三角 图标)3、检查 prometheus 的配置文件,看对应的 组件host 是否在 prometheus 配置文件中(因为高版本的,都是 prometheus 去拉取,所以组件正常的情况下,还需要检查对应组建的状态端口是否正常(不过这个应该都正常,概率较低,组件的状态,端口看官网)
目前对grafana和prometheus进行缩扩容之后,prometheus的各个标签表达式已经能够拉取到数据了
刚才看你的第一次给的监控(其实显示是正常的,只是没数据),需要验证 prometheus 有没有数据,如果有,可能是 grafana 的数据源没配置对(现在没证据,只是瞎猜)
grafana数据源配置也看了下,能对得上dm的集群信息
这个instances的列表信息是从prometheus哪个标签获取的呢,查看接口请求了个key:dm_relay_space
但是在prometheus中没有找到这个标签
哭了,想修复数据库经常连接出问题的情况,升级之后问题+n:joy:
这个监控的问题,不影响集群使用,这个问题的原因,可能不太好排查了
客气了,下次可以分析一下,其实配置就那么几项,我也好奇原因
如果你是指 tidb-dqs-DM-worker-instances 那个 dashboard 的话
instance 到底是啥,可以在 dashboard setting 里的 variables 看到表达式
此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。