开启TLS后再扩容PD节点集群起不来

【 TiDB 使用环境】生产环境 /测试
【 TiDB 版本】v5.4.2
【复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
操作:

  1. 缩容PD至一个节点
  2. 开启TLS :tiup cluster tls tidb-test enable
  3. 扩容PD

扩容完的时候就提示PD节点起不来了,三个PD都是DOWN的状态。
【资源配置】
【附件:截图/日志/监控】
报错节点日志(新扩的):
pd_stderr.log


pd.log

原PD leader节点:

目前集群是否部署阶段开启 TLS? 还是已经使用一段时间开启 TLS ?TiKV 节点是否类似问题?

使用了一段时间,因为ETCD端口未鉴权才尝试开启的, 开启之后也扩过TIKV,没有出现扩不上的问题

新部署了一套全新集群,缩容PD,再开TLS,再扩容PD,也起不来。

扩容的机器能访问日志中那个ip的2379端口吗?

telnet是能通的。


是这个问题导致的吗,tiup的版本是多少,要使用1.11.0及以上的版本
具体可以看看这个:
专栏 - TiDB 生产集群与加密通讯TLS的辛酸苦辣 - 开启篇 | TiDB 社区

版本是v1.11,我就是看得这篇文章开的。

集群架构是啥样的呀

集群架构就是3tidb3pd9kv,最小部署模板,这个问题还没解决,但是我已经通过在部署模板里开启enable_tls参数在部署阶段就开启TLS,把集群新跑起来了。

你的pd有混部在用一个ip上吗。我去看了一下,我开启tls成功的例子,pd都是在不同的ip上部署的,有没有可能和这个相关

我的PD也在不同的机器上,只不过和TIDB在一台机器上, 三台TIDB+PD机器,三台TIKV机器。

您好

建议按照官方文档的步骤操作,https://docs.pingcap.com/zh/tidb/stable/enable-tls-between-components

tiup cluster tls tidb-test enable 这个命令还在实验阶段,暂不建议生产使用。