NODE_disk_write_latency_more_than_16ms经常告警

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】
【复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】

tidb集群安装之后,没什么负载的情况下,经常看到有NODE_disk_write_latency_more_than_16ms
的告警,服务器用的都是阿里云的ESSD盘,想问问大家生产的集群,是关闭了这个告警,还是将告警值调高了。

看上去ESSD盘并不是SSD盘啊,是不是本身读写就慢?一般只有磁盘性能有问题才会出现这个告警。

1 个赞

如果是 PD / TIDB 的话我感觉还好
如果是 TiKV 的话最好还是用机器内的 SSD 而不是这种

磁盘性能太差了呗,16 ms 都不如企业级机械硬盘 :joy_cat:

1 个赞

经常看到这个告警,只能说明你用的磁盘是公用的。
而恰好别人再做一些大io操作。比如备份恢复之类的。你就会收到这个告警。

可以看下Grafana的磁盘相关监控,看下磁盘写入延迟大的期间是否有一些大数据量写入的操作,如果没什么业务磁盘写入延迟还大,那有可能磁盘有问题。

16 ms和ssd不沾边,正常ssd都是<1ms

SSD硬盘在有比较繁忙的读写情况下会出现大的延迟(IO压力测试时能看到),如果你的系统总是这样,建议咨询一下服务提供商,是否有异常。

是本身读写速度就低应该

:joy:这么说的话,物理机》物理虚拟机》云服务器咯,第一次这么直观感受云服务器的不稳定。

1 个赞

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。