首先,v7.5.4版本也有不少生产使用,从直观上判断不大可能是bug。
然后,需要具体问题具体分析,当前你这个问题,tidb-server节点报错明确了无法访问pd节点,说明问题就出现在这。
主要还是确认为什么无法访问pd:
- 你的集群的拓扑是什么样的的?
- 确认其他tidb或tikv节点在故障时段,是否有类似的报错。去查看对应的日志。
- 确认故障时段,是否有pd leader切换。grafana的pd面板可以查看过去一段时间的leader是哪个。
- 确认tidb-server 到pd 节点之间的网络是否正常,可以通过grafana的node_exporter或其他图表查看。