cheng
1
【 TiDB 使用环境】生产环境 /测试/ PCO
【 TiDB 版本】
【遇到的问题】
【复现路径】做过哪些操作出现的问题
【问题现象及影响】
集群初始的grafana 监控是有默认的监控告警项的 但是每个都是no data(集群已经运行了很久了,有监控数据),点进去看 有个报错,网上找了下都没说的很详细, 就说要改Metrics
我还是不明白要怎么弄
metrics 中的sql 要怎么写,是不是可以直接使用文档中的报警规则, 还有如果我要配置途中机器内存使用率的告警的话 我要从哪个监控项下的alert 进去呢
TiDB 集群报警规则 | PingCAP Docs
图1:
1、如果是刚启动的集群,no data 就等等看;
2、如果不是,检查下每个节点 export 进程是否正常;
图2:
1、监控参数中有变量配置不对,检查下参数配置吧(检查时有无效的变量还是变量参数不对);
图3:
这个告警配置我也不太清楚,咨询下其他老师
cheng
6
配置文件中的告警项和官方文档中配置的一样的, 但是grafana中其实是没有这个告警项的
能不能截图下配置过程
cheng
7
我不是要收集prometheus的数据 我是要配置监控告警 - 就是grafana 上的告警
Aric
(Jansu Dev)
10
system
(system)
关闭
11
此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。