tidb集群使用tiup从4.0.2升级到5.3.1后,集群响应变慢

Hi,看了一下监控,延迟主要在 PD get TSO wait 时间再 50-100ms 左右和 PD TSO RPC duration 延迟一致。查询了 PD 的监控,PD Server TSO handle time 小于 1 ms ,初步定位是网络延迟导致。TiDB 和 PD Server CPU、内存使用率没有负载都非常低,所以建议优先排查节点间的网络延迟,PD leader 到 TiDB server 的情况。可以参考一下这篇文档。TSO 慢排查手册 v2.0