tiup 安装dm无法启动 alertmanager_servers ,吐了我吐了,一直报9093 timeout

【 TiDB 使用环境】/测试/
【 TiDB 版本】v8.1.0
【复现路径】照着网关安装得
【遇到的问题:问题现象及影响】无法Starting component alertmanager
Starting instance 我的ip:9093

Error: failed to start alertmanager: failed to start: 我的ip alertmanager-9093.service, please check the instance’s log(/home/tidb/dm/deploy/alertmanager-9093/log) for more detail.: timed out waiting for port 9093 to be started after 2m0s
启动 dm

【附件:截图/日志/监控】
level=info msg=“Starting Alertmanager” version=“(version=0.26.0, branch=HEAD, revision=d7b4f0c7322e7151d6e3b1e31cbc15361e295d8d)”
ts=2024-06-19T14:20:20.092Z caller=main.go:246 level=info build_context=“(go=go1.20.7, platform=linux/amd64, user=root@df8d7debeef4, date=20230824-11:11:58, tags=netgo)”
ts=2024-06-19T14:20:20.092Z caller=main.go:278 level=error msg=“unable to initialize gossip mesh” err=“create memberlist: Could not set up network transport: failed to obtain an address: Failed to start TCP listener on "我的ip" port 9094: listen tcp 我的ip:9094: bind: cannot assign requested address”

本地防火墙是否关闭

ssh 上去你的那个 alertmanager 的 ip
看一下端口是不是占用了

补充一下部署拓扑,如果不是网络/防火墙的问题,会不会是你都部署在一个机器上,导致cpu不足造成的超时?

还有你的ip在日志中是裸奔的,我帮你编辑了一下。

1 个赞

无法建立网络传输:获取地址失败;这个是不是端口被占用了

谢谢,测试得环境 只有一个 这个服务 ,8+16 核 应该没有问题把,我去看下 拓补

不会得 已经查过,防火墙都是开得

不会得 已经查过,防火墙都是开得1

查过端口有没有被占用

这就是问题了,一套集群组件很多,集中启动的时候可能有些组件2分钟抢不到cpu执行时间很正常。

而且我看你好像还在这台上部署了tidb又部署了dm?

这样资源更加紧张。

目前的解决方式如果不能加机器,只能

https://docs.pingcap.com/zh/tidb/stable/tiup-component-cluster#--wait-timeoutuint默认-120

调整这个参数,无论是tiup cluster 还是tiup dm都有这个参数,默认的超时时间是120——2分钟,调到600,也就是10分钟的启动时间。看看能不能起来,如果还不行,再调大点。

灭有

我试试,感谢大哥,我看cpu占用也不高,

新开一台机器也无法启动这个9093/9094 我试过了

600 也无法启动,有帖子说 是ip的问题,可是我看了ip都对

ifconfig能看到你那个外网的ip嘛?
如果ifconfig看不到这个外网的ip只能绑在0.0.0.0上,因为你一直说是防火墙没问题。如果能看到外网ip,我觉得不应该绑不上。

ip没有问题的

1 个赞

关闭防火墙试试呢