alertmanager-9093无法正常启动

你好,用 tiup cluster start 命令启动集群,只有alertmanager-9093启动不起来,试过v4.0.0-rc 和v4.0.1两个版本,都报这个问题。具体alertmanager.log日志附件:

alertmanager (2).log (31.2 KB)

conf/alertmanager.yml
看下这个文件在 altermanager deploy dir 下是否存在。

这个文件只有一份,在tidb-deploy/alertmanager-9093/bin/alertmanager/alertmanager.yml这个路径下

altermanager Deploy Dir路径是:/data/tidb/tidb-deploy/alertmanager-9093,这个文件目前路径是/data/tidb/tidb-deploy/alertmanager-9093/bin/alertmanager/alertmanager.yml,不知是否会有影响?

保证在 deploy dir conf 下有此文件,

可以看下 script/run_xx.sh 里面有服务启动参数,需要再某个路径下存在该配置文件

你好,我把alertmanager.yml这个文件拷贝到conf文件夹下,这个问题就解决了。谢谢啦!但为何自动安装部署的时候,没有默认到conf这个文件夹下面?

你好,请问你使用的是哪个版本的 TiUP?
麻烦执行以下命令看下输出:
tiup --version
tiup cluster --version

tiup --version
v1.1.0 tiup
Go Version: go1.13
Git Branch: release-1.1
GitHash: 3988f6f

tiup cluster --version
Starting component cluster: /home/tidb/.tiup/components/cluster/v1.1.0/tiup-cluster --version
tiup version v1.1.0 tiup
Go Version: go1.13
Git Branch: release-1.1
GitHash: 3988f6f

Hi~ 非常抱歉,经查这是 v1.1.0 新引入的一个 bug,workaround 方案:

  1. 如果你实际上不需要alertmanager,那么选择以下方法之一:
    a. 如果是新集群,可以删除集群,在 topo 文件中移除 alertmanager 之后重新部署
    b. 如果集群中已经有数据,可以通过 scale-in 操作将 alertmanager 缩容
  2. 如果你的集群需要 alertmanager,则可以将 默认配置 拷贝到中控机上的一个目录里,然后修改成你需要的配置,然后执行 tiup cluster edit-config 在 alertmanager 的配置下面加上 config_file 字段,例如:
alertmanager_servers:
  - host: 172.16.5.140
    config_file: /path/to/alertmanager.yml  # 中控机上的目录

然后执行 tiup cluster reload -R alertmanager 就能将配置刷新

我把alertmanager.yml这个文件拷贝到conf文件夹下,已经成功启动,这样没啥问题了吧?

这样也没问题,不过拷过去的是默认的配置文件,alertmanager 实际上发不出来通知,相当于没配置

明白了,多谢

:call_me_hand:

已在 v1.1.1 修复

升级到v1.1.1 的话,就不会有这问题了吧?

是的,升级到 v1.1.1 可解决,升级方法:
tiup update cluster

好的,谢谢

:call_me_hand:

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。