tidb 慢查询监控告警调试 promethues

【 TiDB 使用环境】生产环境
【 TiDB 版本】7.5.1

【遇到的问题:问题现象及影响】
没有找到tidb 慢查询监控 的值班在哪个配置文件配置,以及哪个监控指标。慢查询告警配置指标

【附件:截图/日志/监控】


image
grafana 监控指标 慢查询在哪个面板

是要看这个变量吗?
SHOW GLOBAL VARIABLES LIKE ‘%tidb_slow_log_threshold%’;

我是想找promethues 里的监控

grafana里没有慢查询监控,只有dashboard有。你有什么需求?

是想要看这个监控图吗,在tidb–>query summary里

是的。在哪个面板里呢,没有找到这个所在面板


这是我这边的面板

有需求,我需要找到promethues 的慢sql 监控,然后通过promethes配置告警

是想要看这个监控图吗,在tidb–>query summary里 啦啦啦啦给你发了

tidb.rules.yml: - alert: TiDB_query_duration
这个也类似慢sql

TiDB_query_duration
报警规则:
histogram_quantile(0.99, sum(rate(tidb_server_handle_query_duration_seconds_bucket[1m])) BY (le, instance)) > 1
规则描述:
TiDB 处理请求的延时。99% 的请求的响应时间都应在 1 秒之内,否则报警。
处理方法:
查看 TiDB 的日志,搜索 SLOW_QUERY 和 TIME_COP_PROCESS 关键字,查找慢 SQL

好的,稍等我找一下

截图里似乎不全,是在prod-dc-new-tidb-TiDB

这个是监控p99请求延迟的,如果只是想某个sql执行时间超过一个阈值就告警的话可以在slow query那个监控图加个grafana的告警或者写个脚本定时比如一分钟查一次有执行超过10分钟的然后告警

prod-dc-new-tidb-TIDB 里就有两个路径,没有找到 slow query

image

嗯,我们也有写脚本的
或者写个简单的pushgateway,手动增加一个自己需要的指标也行,这种能直接在prometheus里使用

默认是没有这个slw query展示的是吗,是需要写脚步展示 slow query 是吗

不用,看官网文档也是有的

我看官方也是有,能看看你的那个是在哪个面板里吗?

就在 集群名-TiDB 这个里面

这个应该是请求延迟,不能代表慢查询

这个promethues 的慢查询表达式 是哪个