*系统版本 & kernel 版本:CentOS Linux release 7.4.1708 (Core) *TiDB 版本:tidb-ansible-v3.0.0 *磁盘型号:普通硬盘,在系统预检测阶段将系统和磁盘的检测注释掉。以前也是这个,没有问题。 *集群节点分布:2Tibd-server,3PD,3TiKV *数据量 & region 数量 & 副本数:未做具体要求,默认值,测试环境 *集群 QPS、.999-Duration、读写比例:无
问题描述(我做了什么): tidb-ansible集群部署工具是以前在vmware上部署过的,然后用tidb用户直接拷贝过来使用。 在私有云上部署tidb服务,预检测和部署都OK,但是启动集群的时候在启动tikv时报错:
报错如下: p=23091 u=tidb | [10.0.1.33]: Ansible FAILED! => playbook: start.yml; TASK: wait until the TiKV port is up; message: {“changed”: false, “elapsed”: 300, “msg”: “the TiKV port 20160 is not up”}
p=23091 u=tidb | [10.0.1.34]: Ansible FAILED! => playbook: start.yml; TASK: wait until the TiKV port is up; message: {“changed”: false, “elapsed”: 300, “msg”: “the TiKV port 20160 is not up”}
p=23091 u=tidb | [10.0.1.35]: Ansible FAILED! => playbook: start.yml; TASK: wait until the TiKV port is up; message: {“changed”: false, “elapsed”: 301, “msg”: “the TiKV port 20160 is not up”}
1.查看报错日志,tisb-ansible/log/fail.log 里面的报错信息和界面上显示的是一样的,无法定位到报错原因。
2.将集群销毁掉重新预检测、部署、启动还是报一样的错。
- 直接到tikv节点执行tikv启动脚本,只出现下列几行信息。服务未起来。 [tidb@node01 scripts]$ ./run_tikv.sh sync … real 0m0.064s user 0m0.015s sys 0m0.016s ok
Segmentation fault
另外:
- Tidb-ansible集群部署工具是通过以前部署过的机器上拷贝过来的,权限没有问题,用tidb用户拷贝的。
2.私有云上的虚拟机访问时通过端口映射的方式访问的。
请帮忙分析下问题出在哪?