tiup 接管ansible部署的集群启动节点报错

版本 4.0.4
操作tiup接管ansible的集群,接管后使用tiup进行维护发现,启动报错,具体如下

通过报错信息发现,是因为service文件找不到,但是这个端口本身就不是当前集群的端口,就是说接管后的配置信息与原集群不符合:
1、原集群ini文件配置了 node_exporter_port = 11051

2、升级后的meta文件的是 node_exporter_port: 9100
%E5%9B%BE%E7%89%87

3、group_vars/monitored_servers.yml没有node_exporter_port的配置

4、node的service文件

不知道是哪块出问题了,导致这个问题的。

另外这个能稳定复现:
1、销毁当前集群
tiup cluster destroy tidb-dev-051-v4.0.4

2、使用ansible重新部署
ansible-playbook -i inventory_titan002_for_dev.ini deploy.yml
ansible-playbook -i inventory_titan002_for_dev.ini start.yml

3、tiup接管
cd tidb-ansible-4.0.4-titan002-for-dev
tiup cluster import --inventory inventory_titan002_for_dev.ini

4、使用tiup维护节点
tiup cluster start tidb-dev-051-v4.0.4 -N 192.168.168.11:15051

在 inventory.ini 中将 node_exporter_port 设置为非默认端口 tiup 不支持导入,可以试试设置 group_vars/all.yml 中的 node_exporter_port

已经测试,这个可行

1 个赞

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。