tiup启动集群Prometheus启动失败

你好,执行tiup cluster:v0.4.9 start tidb-test后,显示

能否帮查看一下是何种原因导致

日志文件 tiup-cluster-debug-2020-04-29-09-45-48.log (123.9 KB)

集群状态

1、Prometheus 启动报错,请到 Prometheus 部署目录找到 log 文件看下是否有相关报错信息,Prometheus 的 log 路径请查看 topo 文件的配置:

2、请 Prometheus 服务的状态,服务是 systemd 的形式存在:

systemctl status prometheus-9090.service

3、请检查 Prometheus 所在服务器的 /var/log/messages 是否有相关的报错信息

你好, 1、Prometheus 启动报错,请到 Prometheus 部署目录找到 log 文件看下是否有相关报错信息

Re:日志目录为空

2、请 Prometheus 服务的状态,服务是 systemd 的形式存在:

Re:

3、请检查 Prometheus 所在服务器的 /var/log/messages 是否有相关的报错信息

Re:

其中提到没有*.rules.yml文件

1、根据操作系统的报错信息可能是 prometheus-9090.service 服务的配置文件出现了问题,请提供下该文件的完整内容。

2、请确认下当前使用的 tiup 版本是否为最新版本,可以使用 tiup update --self 来更新

之前使用 cluster:v0.5.0存在问题,退回到了v0.4.9,那我试试v0.6.0

嗯啊,好的,如果升级版本后,仍有问题,可以继续跟帖~~

你好,cluster v0.6.0可能有个问题,若不指定-i参数会报错,无法采用密码输入方式?

你好,

tiup v0.6.0 做了优化,默认使用 home 下的密钥,如果要使用密码模式传 -p 或者 --password

home 下的 id_rsa 可以通过 ssh-keygen 可以搜索下。

你好,换用0.6.0版本后,Prometheus还是无法启动

/var/log/messages中15s后尝试启动还是不行

在指定目录下无message中提到的文件

Prometheus配置文件 prometheus.yml (926 字节)

可以部署了,但启动还是有问题

你好,

3.0 版本,目前建议部署 3.0.13 ,可以换版本试下不,我们这边也会优化一下。

你好谢谢,换用cluster v0.6.0和tidb 3.0.13已经可以正常启动,但查看集群状态时发现pd、tidb、tikv状态为down,请问需要提供什么文件供排查,要不要另开一个帖子:joy:

你好,

开个新帖把,这个可能需要排查下,

  1. 顺带上传下 pd.log tidb.log tikv.log,
  2. 尝试再启动一下,是否可行。
  3. 可以到目标服务器看下是否启动成功
  4. 稍后 display 试下