Ansible部署,启动程序报错

为提高效率,提问时请尽量提供详细背景信息,问题描述清晰可优先响应。以下信息点请尽量提供:

  • 系统版本 & kernel 版本:CentOS 7.3.1611
  • TiDB 版本:ansible 2.7.11
  • 磁盘型号:Disk :16 GB虚拟机 (预研现有配置)
  • 集群节点分布: 10.1.137.84 tidb/pd1/tikv1 10.1.137.82 pd2/tikv2 10.1.137.83 pd3/tikv3
  • 数据量 & region 数量 & 副本数: 百万千万级数据量,目前还没导入数据
  • 集群 QPS、.999-Duration、读写比例:400万的数据量,并发数30,响应时间小于等于200s(这是写的业务要求,目前是在预研,对比mysql性能连表查询百万级的表是否有很大提升)
  • 问题描述(我做了什么):

我按照官方文档ansible集群部署,在执行启动命令报错(ansible-playbook start.yml),

这是两个地址的请求的信息:http://10.1.137.82:9100/metrics:Cannot GET /metrics

http://10.1.137.84:2379/pd/api/v1/cluster/status { “raft_bootstrap_time”: “2019-09-04T14:19:16.758980687+08:00”, “is_initialized”: false }

目的:我想启动TiDB先体验,对比mysql和TiDB的连表性能, 1:可不可以不运行监控系统启动tidb数据库,*如果不可以的话另外一个解决方案:手动安装监控系统(Prometheus 和 Grafana)

1赞

确认 start 之前的操作都是成功的吗? 看下来应该是node_exporter 没有启动。可以到具体节点检查下。

这是刚部署的tidb ,还没启动成功,node_exporter这个需要怎么样检查

我现在想要做的:不运行监控系统 启动tidb数据库需要怎么做呢

这几个步骤确认程序结果都返回的是 ok ? 如果上面返回结果都是 ok,那么:

  1. 登录到节点上 ps 看下是否有 node_exporter 进程;如果没有请 cd 到部署目录中的 script 中执行 start 脚本。
  2. ansible-playbook start.yml --skip-tags 指定跳过的组件。

我确定这些返回的都是OK, 登录到节点上 ps 看下是否有 node_exporter 进程 需要怎么操作?

  1. ssh 登录到目前节点
  2. ps aux|grep node_exporter

我这边都有node_exporter的进程 84中控机 tidb/pd1/tikv1

82 pd2/tikv2 83 pd3/tikv3

这个节点的 node_exporter 没有启动成功,启动成功后,会存在该进程。可以根据日志排查下原因。

kan kan

已经解决 ,我将启动文件的配置修改后启动成功,但是有点隐藏问题,导入数据的时候会出现中断的情况