pd join集群失败

【 TiDB 使用环境】测试
【 TiDB 版本】 v6.1.0
【复现路径】已有集群pd-1,新增pd节点pd-2,根据官方文档描述:


将pd-2通过参数–join加入到pd-1中,启动pd-2,启动失败,报错 [2023/06/12 10:17:28.553 +00:00] [WARN] [stream.go:682] [“request sent was ignored by remote peer due to cluster ID mismatch”] [remote-peer-id=e91fc2eb575225bd] [remote-peer-cluster-id=9d361620aeb0a397] [local-member-id=2c9fc5b208a8cbdb] [local-member-cluster-id=d22fbedef770b55c] [error=“cluster ID mismatch”]。
同时 pd-1也有告警 [2023/06/12 10:18:01.953 +00:00] [WARN] [http.go:543] [“request cluster ID mismatch”] [local-member-id=e91fc2eb575225bd] [local-member-cluster-id=9d361620aeb0a397] [local-member-server-version=3.4.3] [local-member-server-minimum-cluster-version=3.0.0] [remote-peer-server-name=2c9fc5b208a8cbdb] [remote-peer-server-version=3.4.3] [remote-peer-server-minimum-cluster-version=3.0.0] [remote-peer-cluster-id=d22fbedef770b55c]
【遇到的问题:问题现象及影响】无法将pd加入到已有集群中。
【资源配置】
【附件:截图/日志/监控】

换了种方式,在已有pd-1上join要加进来的pd-2,pd-2能正常启动,但问题在于,这两个pd的日志中显示是不同的cluster,用pd-ctl查看也是各自属于各自的集群,这和预期并不相符

根据您的描述,这个问题可能是由于 pd-1 和 pd-2 的集群 ID 不一致导致的。集群 ID 是 TiDB 集群的唯一标识符,如果不同的节点的集群 ID 不一致,就会导致节点之间无法正常通信。

解决这个问题的方法是,确保 pd-1 和 pd-2 的集群 ID 一致。您可以按照以下步骤进行操作:

  1. 在 pd-1 节点上执行命令 tiup cluster display <cluster-name>,查看当前集群的 ID。

  2. 在 pd-2 节点上执行命令 tiup cluster edit-config <cluster-name>,编辑集群配置文件。

  3. 在配置文件中添加以下内容:

[global]
cluster-id = "<cluster-id>"

其中,<cluster-id> 是 pd-1 节点上查看到的集群 ID。

  1. 保存配置文件并退出编辑器。

  2. 在 pd-2 节点上执行命令 tiup cluster reload <cluster-name> -R pd-ctl,重新加载集群配置。

  3. 在 pd-2 节点上执行命令 tiup cluster start <cluster-name> -R pd-ctl,启动 pd-2 节点。

如果以上方法无法解决问题,您可以尝试重新初始化 TiDB 集群