Grafana 报警问题

grafana 报警触发之后只会发报警一次,恢复也不发。 请问怎么配置能重复发报警,并且恢复也发呢

这边是用的 Alertmanager 告警组件吗? 如果是的话。默认情况下首次发送告警 30s 后,重复发送间隔是 3m。

1赞

是使用grafana自带的alert组件

告警的发送主要与 Alertmanager 组件和 prometheus 有关。请检查 Alertmanager 正常运行,并且 prometheus 配置了告警。

在alertmanager.yml配置文件里面可以设置。

告警重复发送间隔

repeat_interval : 3m

恢复的时候也会发告警:

send_resolved : true.

设置之后重启prometheus生效

- name: 'db-alert-email'
  email_configs:
  - send_resolved: true
    to: 'xxx@xxx.com'
2赞

TiDB - Ansible 的部署方式如下:

prometheus 中配置Alertmanager 的服务,如:

 alerting:
  alertmanagers:
  - static_configs:
    - targets:
      - 'alertmanager_host:9093'

告警规则,如:

rule_files:
  - 'node.rules.yml'
  - '...'

触发告警后 prometheus 将其推送至 Alertmanager。

Alertmanager 配置,如:

告警服务器配置:
  smtp_smarthost: 'localhost:25'
  smtp_from: 'alertmanager@example.org'
  smtp_auth_username: 'alertmanager'
  smtp_auth_password: 'password'

group_wait: 30s --首次告警发送间隔
repeat_interval: 3m -- 重复告警发送间隔

涉及修改配置文件的操作需重启生效

Prometheus + Alertmanager 更详细的介绍,请参考 https://prometheus.io/docs/

感谢支持