【 TiDB 使用环境`】生产环境
【 TiDB 版本】v4.0.10
【遇到的问题】日志中很多警告
我找了对应的服务器上,并没有这个端口,不知道这是在干什么?
这个报错好像是 etcd 的报错,排查下PD的状态和监控有没有啥问题,
etcdserver: http2Server.HandleStreams failed to read frame · Issue #7926 · etcd-io/etcd (github.com)
节点都正常的话,可以尝试重启一下 PD 节点。
这些端口我都没有
这个不影响您的使用,我猜10.1.3.61应该是您pd集群的leader,51,52,62,63是其余的pd,至于为什么会有这么多端口,这是etcd服务临时启动的用来与主etcd通信的端口,在golang里面,通过etcd/lcientv3 远程访问etcd服务的时候,由于v3与http包的差异,会导致这个warning,这是grpc升级遗留下来的问题。
51 52上并没有pd服务,我们是三天之内发生了两次pd集群三个节点全部挂掉的情况。
能把这个几个ip的部署组件说明一下吗?
51 52 tidb tikv
51 grafana alertmanager prometheus
61 62 63 pd tikv cdc
集群状态是否有什么异常,这些端口应该是临时端口,用于通信的,是否可以考虑重新启动一下
异常就是三天之内pd三个节点挂了两次
告警日志不用管,搜索下配置文件里关于这个地址和端口的配置。
并没有这个配置。我也想不管,但是pd三天挂了两次,还找不到原因,不得不多怀疑怀疑。这个3.132都不在集群中,不知道哪里来的通信
display 看下拓扑吧,另外你也可以确认下 这套集群是否有缩容过,之前是否用过 3.132
另外我看你的集群中也有配置 cdc,可以看下 PD 挂掉的时候,cdc 监控是否有异常。