部署初始化失败

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】:v3.0.0
  • 【问题描述】:初始化初始化系统环境 出现错误tidb 所在机器内存不足 没有动这个参数啊 这个在哪调

若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。


请问是进行 Dev 或者测试环境部署吗? 是的话可以在 anxible-playbook 后面加上 --extra-vars “dev_mode=true”

跳过可以 但是不应该啊 我是按照文档标准配置的资源

具体可以参考下 ansible 的逻辑。 https://github.com/pingcap/tidb-ansible/blob/41649292bf775e56f95fb5837a057ce75af069c3/roles/check_system_optional/tasks/main.yml#L36

https://github.com/pingcap/tidb-ansible/blob/00cf2e41dabc322f02fa344853ded1c8fdd16e93/library/coreos_facts#L69

部署安装的时候 操作到中控机所在节点 就变得很缓慢 有过类似情况么

有相关的日志或者报错吗? 麻烦提供一下。或者在 ansible-playbook 的时候加上 -vvv 看下更详细的输出,看看有没有异常。

具体没有报错 部署的时候耗时比较长 还有这么个错误 之前没遇到过

现在的现象是在安装部署时,也是可以部署成功的但是在中控机上进行 tidb、tikv 或 pd 的相关配置时耗时比较长是吗?

对 部署中控机所在节点 就会耗时特别长 更换中控机节点也是一样 然后就会跳出 上面那个Timeout问题 然后部署失败

从报错信息看是权限设置问题,请查考下下述 issues :

https://github.com/pingcap/tidb-ansible/issues/344

按照文章中添加了 -k -K 但是还是不行 中控机上的部署操作依旧特别慢 还是出现超时错误 部署tidb 用户名必须是tidb么 ssh免密和sudo 都测试了 也没有问题啊 ansible.log (166.7 KB)

tidb 在部署时,默认使用 tidb 用户进行相关的部署操作。

方便的话,也请提供下部署使用的 inventory 文件,谢谢

部署的时候 我统一更改了用户名 是这个影响么 inventory.ini (2.0 KB)

帮忙看下中控机相应的 sudo 是如何配置的,如果方便请上传截图,谢谢~

是这个么 不同的用户 我都试过了
QzpcVXNlcnNcQWRtaW5pc3RyYXRvclxBcHBEYXRhXFJvYW1pbmdcRGluZ1RhbGtcNzA2NTM0MTIwX3YyXEltYWdlRmlsZXNcMTU4MjcwNjA3Nzc5OV8wMjY5QTA4RC0yNkYzLTQ3MjMtOEYzMi04N0M0RjcyNEJGQzQucG5n

切换中控机 我也是了 还是不行 除非跳过中控机(中控机不做部署任务) 但这不合理啊

结合 inventory 文件和报错日志,如果在安装部署时统一使用的都是 poitech 用户,但是上面的报错信息显示的是 ssh 的是 tidb 用户。再次确认下,在安装部署时,是否是按照官网的操作步骤,将 tidb 用户都替换成了poitech 用户:

tmp.log (100.9 KB)
我跳过了中控机部署 打算先安装其他节点(这一步成功了) 然后扩容中控机节点 还是出现超时错误 而且这次我看用户配置是正确的

扩容中控机,但是出现报错,这部的完整的 ansible log 提供下~

刚才说的不够详细 日志就是上面那个 扩容节点试了两次 后面的那次部署成功了 但是死活启动不了 就是那个超时错误