ansible集群新增节点报错

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】:v3.0.8
  • 【问题描述】:新增一个pd节点。执行到 ansible-playbook deploy.yml步骤报错

如下错误

TASK [check_system_dynamic : Preflight check - ulimit -n] ************************************************************************************************************************************* fatal: [172...**]: FAILED! => {“changed”: false, “msg”: “The default maximum number of open file descriptors is too low 4096, should be 1000000”}

NO MORE HOSTS LEFT **************************************************************************************************************************************************************************** to retry, use: --limit @/home/tidb/tidb-ansible/retry_files/deploy.retry

PLAY RECAP ************************************************************************************************************************************************************************************ 172...*** : ok=5 changed=0 unreachable=0 failed=1

ERROR MESSAGE SUMMARY ************************************************************************************************************************************************************************* [172...**]: Ansible FAILED! => playbook: deploy.yml; TASK: check_system_dynamic : Preflight check - ulimit -n; message: {“changed”: false, “msg”: “The default maximum number of open file descriptors is too low 4096, should be 1000000”}

  1. 扩容 PD 节点请详细按照官方文档里面的步骤进行: https://pingcap.com/docs-cn/stable/how-to/scale/with-ansible/#扩容-pd-节点
  2. 这个报错看起来是 open file descriptors 不足。麻烦在问题机器执行下以下的命令确认 :ulimit -H -n

1、在 bootstarp阶段会修改

2、如果再次出现这个问题,请先自行检查下目标服务器 unlimit 的配置是否生效

3、清理下 ansible 缓存,清理方法请参考 ansible 官网相关资料