PD 和 PD 之间连接过多,还在持续创建连接

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】: v3.0.5
  • 【问题描述】:PD 和 PD 之间已经建立了很多连接,ESTABLISHED都有5万多个了,还在尝试建立新的连接,导致无法分配端口资源了。

导致大量以下的报错

[2020/07/05 22:52:03.497 +08:00] [WARN] [grpclog.go:60] [“grpc: addrConn.createTransport failed to connect to {xxx.xxx.108.63:2379 0 }. Err :connection error: desc = "transport: Error while dialing dial tcp xxx.xxx.108.63:2379: connect: cannot assign requested address". Reconnecting…”]

截图的机器是 108.63 的机器,通过kill pd 的一个节点已经恢复,没有现场了。
请问出现这么多连接会是什么原因导致的

1.请问问题发生时,pd状态正常吗?
2.请检查这个pd的pd.log 日志,是否有报错
3.请检查这段时间message日志,是否有报错

这个集群还没上线,监控没上:joy_cat:,查找日志,没有发现有关联的错误信息

一般什么情况下会触发这种问题 :grinning:

可以参考下这篇文章,看看参数能否调整 https://blog.csdn.net/wenshuangzhu/article/details/44060901