【 TiDB 版本】V6.5.10
【遇到的问题:问题现象及影响】新环境部署集群,一个pd,一个tidb-server,三个tikv,grafana、pd、prometheus都可以启动。但是tikv无法启动。报错如下。
[2024/09/13 14:13:24.649 +08:00] [INFO] [util.rs:599] [“connecting to PD endpoint”] [endpoints=172.16.0.85:2379]
[2024/09/13 14:13:26.650 +08:00] [INFO] [util.rs:561] [“PD failed to respond”] [err=“Grpc(RpcFailure(RpcStatus { code: 4-DEADLINE_EXCEEDED, message: "Deadline Exceeded", details: }))”] [endpoints=172.16.0.85:2379]
[2024/09/13 14:13:26.650 +08:00] [WARN] [client.rs:164] [“validate PD endpoints failed”] [err=“Other("[components/pd_client/src/util.rs:594]: PD cluster failed to respond")”]
[2024/09/13 14:13:26.951 +08:00] [INFO] [util.rs:599] [“connecting to PD endpoint”] [endpoints=172.16.0.85:2379]
[2024/09/13 14:13:28.952 +08:00] [INFO] [util.rs:561] [“PD failed to respond”] [err=“Grpc(RpcFailure(RpcStatus { code: 4-DEADLINE_EXCEEDED, message: "Deadline Exceeded", details: }))”] [endpoints=172.16.0.85:2379]
【附件:截图/日志/监控】
Tikv 在设定的时间内没有收到 PD 的响应,先检查一下tikv到PD的网络连接是否有问题, 网络防火墙是否有拦截等。
2 个赞
唉。我看别的帖子也是这么说。但是我查了防火墙,都是关闭了。然后我装了一个nginx测试。果然不通。我就去问电信的人。电信告诉我他们安全组默认全阻止。心好累。
优秀,安全最大
把默认的安全组去掉,自己建一个覆盖下
默认全阻止,这对于电信本身来说也是最安全的,然后自己根据端口放开,如果不是全阻止,万一哪天被攻击了,说电信的安全策略设置的有问题
让网络的人把tidb使用的端口都开放
都说网络策略的问题,这种应该先排查的
先把 tidb所需要的所有端口。提前全部和安全组运维的人说一下。这几个端口全部打开