pd 日志:transport: http2Server.HandleStreams failed to read frame。

【 TiDB 使用环境`】生产环境
【 TiDB 版本】v4.0.10
【遇到的问题】日志中很多警告

我找了对应的服务器上,并没有这个端口,不知道这是在干什么?

1 个赞

这个报错好像是 etcd 的报错,排查下PD的状态和监控有没有啥问题,
etcdserver: http2Server.HandleStreams failed to read frame · Issue #7926 · etcd-io/etcd (github.com)

节点都正常的话,可以尝试重启一下 PD 节点。

1 个赞

这些端口我都没有

1 个赞

这个不影响您的使用,我猜10.1.3.61应该是您pd集群的leader,51,52,62,63是其余的pd,至于为什么会有这么多端口,这是etcd服务临时启动的用来与主etcd通信的端口,在golang里面,通过etcd/lcientv3 远程访问etcd服务的时候,由于v3与http包的差异,会导致这个warning,这是grpc升级遗留下来的问题。

2 个赞

51 52上并没有pd服务,我们是三天之内发生了两次pd集群三个节点全部挂掉的情况。

1 个赞

能把这个几个ip的部署组件说明一下吗?

51 52 tidb tikv
51 grafana alertmanager prometheus
61 62 63 pd tikv cdc

集群状态是否有什么异常,这些端口应该是临时端口,用于通信的,是否可以考虑重新启动一下

异常就是三天之内pd三个节点挂了两次

上次pd挂掉时还出现过这个日志,但是这个3.132节点都不在我的集群中

告警日志不用管,搜索下配置文件里关于这个地址和端口的配置。

并没有这个配置。我也想不管,但是pd三天挂了两次,还找不到原因,不得不多怀疑怀疑。这个3.132都不在集群中,不知道哪里来的通信

display 看下拓扑吧,另外你也可以确认下 这套集群是否有缩容过,之前是否用过 3.132

另外我看你的集群中也有配置 cdc,可以看下 PD 挂掉的时候,cdc 监控是否有异常。

没有缩容过。wf-tidb-TiCDC_2022-04-18T09_03_44.527Z.json (8.2 MB)