【 TiDB 使用环境】
【概述】:场景 + 问题概述
经常会有这个告警,看了告警时段的机器负载,log,都没发现异常,请问这种问题要怎么排查?谢谢!
【背景】:做过哪些操作
【现象】:业务和数据库现象
【问题】:当前遇到的问题
【业务影响】:
【TiDB 版本】:V5.0.0
【附件】:
- 相关日志
新建 Microsoft Word 文档.docx (300.9 KB) - 配置文件
- Grafana 监控(https://metricstool.pingcap.com/)
【 TiDB 使用环境】
【概述】:场景 + 问题概述
经常会有这个告警,看了告警时段的机器负载,log,都没发现异常,请问这种问题要怎么排查?谢谢!
【背景】:做过哪些操作
【现象】:业务和数据库现象
【问题】:当前遇到的问题
【业务影响】:
【TiDB 版本】:V5.0.0
【附件】:
看下 tikv detail里的thread CPU-scheduler worker 和sechduler worker 下的pending command和write bytes
看了下告警时间前后1h的这几个监控,都很低
是不是副本数量有问题,从日志看来问题是现在不知道哪个tikv是leader,查一下对应的region 4313的leader在哪个store上看看,是不是这里处理问题,导致重试
又或者是不是leader 频繁发生切换导致的
告警只持续3分钟就停止了,后面再出来按你这个思路查一下,谢谢!
此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。