Propose wait duration alert

  • 【TiDB 版本】:v4.0.0
  • 【问题描述】:Propose wait duration alert 会经常报警, 这个是什么原因,我看 cpu 磁盘等机器指标压力都很小

Raft Propose 下的 Propose wait duration

Propose wait duration 是从发送请求给 Raftstore,到 Raftstore 真正开始处理请求之间的延迟时间。如果该延迟时间较长,说明 Raftstore 比较繁忙或者处理 append log 比较耗时导致 Raftstore 不能及时处理请求。

怎么排查具体是什么原因导致,我看磁盘和 cpu 压力都不大, 是不是配置没有调整好

辛苦反馈下 tikv 节点数和磁盘使用情况,region 和 leader 的数据量,
再看下 tikv detail - Raft IO 监控面板

append log duration 还是有点高,一般要求在 50ms,请问下告警的频率是怎么样子的

请问下告警的频率是怎么样子的

这个指什么? 默认告警是 50ms,因为经常告警(第一张图所示,每隔一段时间就有请求跑到 100ms 以上), 所以我现在改成了 150ms 告警

https://book.tidb.io/session4/chapter7/tikv-is-busy.html

没有 server is busy

根据集群状态将此值适当调整下这个报警,tidb 这边初始值还是比较保守的,可以根据集群出现的问题,或者现象看下是否需要提高配置还是如何