dm 告警设计

监控虽然可以看到状态,但是如何做一个告警出来

可以帮忙看一下吗

在 DM 的 Prometheus 系统中创建一个 Altermanager 服务,Altermanager 中我们提供了部分告警,你可以通过设置 webhook 方式将告警信息同步到企业微信或者其他具有告警功能的软件提供告警。 您可以按照一下步骤完成告警部署:

  1. 通过 dm-ansible 扩容方式创建一个 altermanager 服务;
  2. 根据需求调哼 altermanager 服务中的部分告警阈值;
  3. altermanager 会对外吐出一个 webhook 接口用来为下游提供告警服务。

需不需要运维参与,运维现在说我把阈值改下 应该就可以告警处理

如果运维比较了解这里的情况,可以和运维同学协同完成。

那我就一步一步来吧,dm-ansible 如何创建一个 altermanager 服务

麻烦参考下 inventory 中的配置,另外可以参考下这个链接,通过配置 alertmanager 对 TiDB 故障进行报警

https://book.tidb.io/session3/chapter4/prometheus-guide.html https://github.com/pingcap/dm/blob/a6c877fa4de250e0ae6783d66a913c46ece65f2b/dm/dm-ansible/inventory.ini#L20-L21

好的 谢谢你

好的 感谢

:+1:

当同步任务状态为4的情况,需不需要告警呢,还是只是状态为3的时候才能触发告警

当同步任务状态为4的情况,需不需要告警呢,还是只是状态为3的时候才能触发告警呢

你好,此问题与你其他帖子相似,请关注新帖即可

好的 谢谢

:slightly_smiling_face:

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。