使用tiup部署的集群自动安装了prometheus和alertmanager,怎么将告警信息接入钉钉?

【 TiDB 使用环境】生产环境
【 TiDB 版本】 7.0.5
【复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】

你可以搜索一下alertmanager配置dingding告警的文档,网上有很多。简单来说就是创建钉钉告警群配置机器人(获取webhook、secret信息),然后配置到alertmanager配置里面。

1 个赞

现在已经修改好了alertmanager的配置文件加入钉钉的信息了,卡在了重启了alertmanager服务。集群是通过tiup自动安装了promatheus+alertmanager+grafana,这些服务可以手动停止和启动而不影响到tidb集群呢?

可以的,你指定需要重启的哪一个服务就可以, tiup cluster restart -N 指定就可以

十分感谢

哇哦~学习了,之前想搞告警,因为我这个是2.0升级到4.0的,配置文件都不知道在哪,就自己手动写了一个shell脚本监控发送到飞书的。后面新配置可以看看你这个方法

这命令查看了一下好像是重启集群中的节点,这个有没有在实际中使用过呢?

可以告警接收prometheus api 通过丁丁发送

社区有文章写过:
专栏 - 发送Tidb告警信息到企业微信群实践 | TiDB 社区

1 个赞

好的,十分感谢

已解决,实操过后没问题。
场景:使用tiup部署tidb集群,自动安装了promatheus+alertmanager+grafana。在grafana页面有数据显示,需要在钉钉群接收到告警信息。
操作:服务器上部署钉钉插件服务并运行。钉钉群中获取webhook信息后配置在在钉钉服务中。在alertmanager.yml中配置钉钉的地址信息,重启alertmanager服务即可。
注意:因为是tiup自动安装,规则已默认配置好,无需改动的情况下只需重启alertmanager,如手动修改监控规则后也需重启promatheus服务。

重启命令:
alertmanager:tiup cluster restart tidb集群名字 -N IP:9093 (IP和端口号需要修改成实际alertmanager使用IP+端口)
promatheus:tiup cluster restart tidb集群名字 -N IP:9090 (IP和端口号需要修改成实际promatheus使用IP+端口)

3 个赞

想配置,但是全内网的服务器,没有办法配置

内网可以考虑通过网闸设备实现

自己写个脚本不就行了,前提能上互联网,上不了想办法把脚本获取的结果同步出来。

知道zabbix可以,不过写脚本也可以,原理就是访问http协议,必须能上公网才行。

YYDS,马上测试一下

我们是写的zabbix脚本,然后通过zabbix给钉钉发消息来接入告警的

这是个好方法 学习了

配置alertmanager。