监控演示节点ping延时很大，但手动ping延时很小

Christophe · 2022 年1 月 25 日 01:15

为提高效率，请提供以下信息，问题描述清晰能够更快得到解决：
【 TiDB 使用环境】
【概述】场景+问题概述
监控显示有几个节点ping延时很大，但手动ping又比较小，请问要怎么排查？谢谢！
【背景】做过哪些操作
【现象】业务和数据库现象
【业务影响】
【TiDB 版本】V5.0.0
【附件】

qizheng · 2022 年1 月 25 日 01:42

手动 ping 是对应监控上的两个节点 ip 么，source 是192.168.1.1 的，再查一下 prometheus-ip:9090 页面上的 probe_duration_seconds 记录值是多少

Christophe · 2022 年1 月 25 日 01:44

promethus和alertmanager都是部署在1.1，慢的是1.1以外的节点ping1.1

Christophe · 2022 年1 月 25 日 02:59

参考了这个，但有个疑问手动ping没见多大延时，也不好贸然去找基础部门的人

Christophe · 2022 年1 月 25 日 03:05

我们网卡是1000M卡，不知道是不是这个原因，但监控显示要4秒多就有点离谱，先查下这个指标是统计的啥

xfworld · 2022 年1 月 25 日 07:13

千兆的容易被打满，瞬间打满了，就容易延迟了

我自己配的一台机器，有两块网卡，一块是千兆的，另一块是 2.5Gb的，就这样才能凑合用…

估计你也要考虑下这个情况，最好是万兆

Christophe · 2022 年1 月 26 日 02:35

谢谢！我看网络监控才几十M，按道理不该打满吧？

xfworld · 2022 年1 月 26 日 02:41

你自己多观测一下～这个场景和问题比较常见

Christophe · 2022 年1 月 26 日 09:21

有几台机器防火墙没有放开icmp，第一次检查不仔细。
谢谢！

system · 2022 年10 月 31 日 19:25

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。