网络不通啊,检查集群各个节点之间的网络
看日志信息,应该是pd和tikv的网络互通有问题,你看下tidb cluster dashboad集群状态
和tidb 监控面板的各个节点的额网络状态
看看防火墙有没有关掉,端口有没有被占用
请求pd多长时间不响应视为error ?现在是偶现,我看了延迟偶尔在2毫秒左右
你这个集群是什么环境的?
你整个集群的资源使用情况,现在有topSSql,有大量的读写流浪吗
大量的timeout,网络是不是卡住了
看下心跳上报延迟
pd
这个正常不代表什么,它只是进程正常
这个在哪里看
pd的监控里面,tikv里面region会往pd上报心跳
检查PD状态
telnet 目标ip 相关端口 检查下