版本 4.0.4
操作tiup接管ansible的集群,接管后使用tiup进行维护发现,启动报错,具体如下
通过报错信息发现,是因为service文件找不到,但是这个端口本身就不是当前集群的端口,就是说接管后的配置信息与原集群不符合:
1、原集群ini文件配置了 node_exporter_port = 11051
2、升级后的meta文件的是 node_exporter_port: 9100
3、group_vars/monitored_servers.yml没有node_exporter_port的配置
4、node的service文件
不知道是哪块出问题了,导致这个问题的。
另外这个能稳定复现:
1、销毁当前集群
tiup cluster destroy tidb-dev-051-v4.0.4
2、使用ansible重新部署
ansible-playbook -i inventory_titan002_for_dev.ini deploy.yml
ansible-playbook -i inventory_titan002_for_dev.ini start.yml
3、tiup接管
cd tidb-ansible-4.0.4-titan002-for-dev
tiup cluster import --inventory inventory_titan002_for_dev.ini
4、使用tiup维护节点
tiup cluster start tidb-dev-051-v4.0.4 -N 192.168.168.11:15051