DM 集群 下线dm-worker节点失败 & dm-worker 下线流程

在部署DM WORKER的时候,对应的worker节点上实例已经失效,所以要下线该节点,换成新的实例。
但执行该命令时执行失败
[tidb@pro-bi-dm-195-62 dm-ansible]$ ansible-playbook stop.yml --tags=dm-worker -l dm_worker1
[WARNING]: Could not match supplied host pattern, ignoring: dm_worker1

ERROR! Specified hosts and/or --limit does not match any hosts

请确认下 dm_worker1 在 inventory.ini 文件中是作为别名存在的,并且大小写一致。

image

dm-worker1 这里是中划线

:joy:, 额,我自己给自己挖坑啊。

同时请教一下,因为刚刚我的错误输入,所以执行命令没有成功,所以我直接在dm-worker1节点上执行了
[tidb@pro-bi-dm-195-63 scripts]$ ./stop_dm-worker.sh

然后再按照正常操作

  1. 配置并重启 DM-master 服务。
    ansible-playbook rolling_update.yml --tags=dm-master

  2. 配置并重启 Prometheus 服务。Copy
    ansible-playbook rolling_update_monitor.yml --tags=prometheus

这个流程是否可以正常下线我的那个 dm-worker节点

同时请教一下,dm-worker 更换不同的实例,有没有便捷的更改方式,还是说必须按照 先下线节点,清理节点上dm目录,同时再按照添加新节点的方式,来上线该节点?

流程没问题,再把 inventory 的 dm worker 那一行注释掉就可以了

由于 dm worker 和 上游 mysql 实例是一一对应的,需要先做下线,再添加新的的节点连接到相同的 mysql 实例

好的,谢谢
还有就是我按照我描述的步骤下线dm-worker1节点以后,
重启prometheus
去监控页面,还是可以查到我下线的节点,这个正常吗?
理论上,我下线了节点,应该监控就不会有该节点的信息

prometheus 不会自动清理历史数据,只是把相应的配置项去掉了

历史数据默认保留 30 天,过一段时间这个 dm worker 不再上报数据,就看不到了

好的,谢谢

:handshake:

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。