使用 ansible 单独启动 TiFlash 卡住

使用:

ansible-playbook -t tiflash start.yml

启动TiFlash,无法成功。报错信息如下:

TASK [wait until the TiFlash port is up] **************************************************************************************************************************************************************************************** fatal: [192.168.30.30]: FAILED! => {“changed”: false, “elapsed”: 300, “msg”: “the TiFlash port 8123 is not up”} to retry, use: --limit @/home/tidb/tidb-ansible/retry_files/start.retry

PLAY RECAP ********************************************************************************************************************************************************************************************************************** 192.168.30.30 : ok=4 changed=0 unreachable=0 failed=1
192.168.30.31 : ok=3 changed=0 unreachable=0 failed=0
192.168.30.32 : ok=3 changed=0 unreachable=0 failed=0
192.168.30.33 : ok=3 changed=0 unreachable=0 failed=0
192.168.30.34 : ok=3 changed=0 unreachable=0 failed=0
localhost : ok=7 changed=4 unreachable=0 failed=0

ERROR MESSAGE SUMMARY *********************************************************************************************************************************************************************************************************** [192.168.30.30]: Ansible FAILED! => playbook: start.yml; TASK: wait until the TiFlash port is up; message: {“changed”: false, “elapsed”: 300, “msg”: “the TiFlash port 8123 is not up”}

  1. 请问这边使用的是哪个版本呢?
  2. 麻烦确认下 inventory.ini 文件 tiflash 部分的配置是否配置正确。这边如果是新增加 tiflash 的话 ,可以重新跑一下 ansible-playbook deploy.yml -t tiflash -vvv 看看 deploy 过程有没有失败。

版本:3.1.0-RC

配置:

[tiflash_servers]

192.168.30.30 data_dir=/data1/tiflash

重跑过好几次了,每次都是到等待端口up这一步失败报错。

麻烦提供一下 ansible-playbook deploy.yml -t tiflash -vvv 以及 ansible-playbook start.yml -t tiflash -vvv 的结果

deploy-vvv.txt (1.5 MB) start-vvv.txt (84.4 KB)

上面的文件为日志Log

这边麻烦到问题的机器进行排查:

  1. /data1/deploy/scripts/run_tiflash.sh 执行看看手工执行该脚本看能否拉起 tiflash
  2. 麻烦到 {deploy_path}/log 下面看看 tiflash 的日志有没有相应的报错。

[tidb@localhost scripts]$ ./run_tiflash.sh sync … real 0m0.003s user 0m0.000s sys 0m0.001s ok

bin/tiflash/tiflash: error while loading shared libraries: libnsl.so.1: cannot open shared object file: No such file or directory

解决方案:

centos8: dnf install libnsl

:+1: 目前推荐版本是 centos7 ,也是用户使用最多的版本。