全新部署dm v2.0.4版本,grafana无法获得worker节点信息

为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:
【 TiDB 使用环境】

【概述】
上次问题为从2.0.1升级为2.0.4版本后grafana的dashboard无法展示worker节点的磁盘信息,binlog同步信息,binlog的master&salve相关信息。
链接:dm从2.0.1升级到2.0.4后grafana监控binog指标无信息 - #11,来自 freywan

目前已经销毁了之前构建集群,重新搭建了一个初始版本v2.0.4的dm集群,但是任然发现dashboard无法展示相关信息,task的状态信息可以通过DM-task的面板查看。这个问题能帮忙确认下吗,是否为构建或者升级项目后,grafana的相关配置存在问题,导致无法从prometheus获取对应信息。
新部署的dm集群信息


image
这部分worker列表信息是否对应为下图的label_values(dm_relay_space, instance)

在prometheus中查询函数也提示错误

其他例如worker硬盘资源信息:



查询不出错,但是没有数据

请大佬帮忙看一下


补充,作为对比测试,和下面1楼对比,都是在创建完成节点后,加入一个数据源,并且创建一个任务情况下,在prometheus中查询dm_relay_space函数,v2.0.4版本无法查询结果

【附件】
部署文件:
tidb-dqs.yaml (2.8 KB) tidb-dqs-10.215.200.147-8268.yaml (286 字节)

使用V2.0.1版本又构建了一套
在创建完成节点后,加入一个数据源,并且创建一个任务情况下
通过dm_relay_space查询后,可以在prometheus得到数据信息

使用上方相同方法构建v2.0.3版本



image

grafana和prometheus无法获取dm_relay_space信息

默认是不开 relay_log 的,没数据我理解是正常的。需要手动打开 relay_log 才可以。

1 Like

打开relay-log是开启enable-relay选项吗,配置文件是全部开启的

自 v2.0.2 起,上游数据源配置中的 enable-relay 项已经失效。

在 v2.0.2 及之后的版本中, start-relaystop-relay 命令分别用于启动及停止 relay log 的拉取。

start-relay 命令可以配置一个或多个 DM-worker 为指定数据源迁移 relay log,但只能指定空闲或者已绑定了该上游数据源的 DM-worker

更多内容可与参考文档哈 https://docs.pingcap.com/zh/tidb-data-migration/stable/relay-log#dm-relay-log

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。