tiup cluster reload报错

tiup-cluster-debug-2020-06-10-17-22-23.log (107.7 KB)

我在修改完 ```
performance.txn-total-size-limit: 1073741824

后reload时候报错,还是告诉我没有认证,没有权限。请帮忙看下,谢谢!

你好,

  1. 看下 tmp 目录是否满了,
  2. 看下各个服务器节点是否同学正常,尤其是 drainer 和中控机,部署用户是否可以免密登录,并有 sudo 权限。
  3. display 上传,看下集群状态
  4. edit-config 看下修改参数的位置,并上上传截图即可

1./tmp目录有足够空间,新机器
2.drainer和中控机部署在一起,可以sudo su - root
3.


4.

  1. 是修改这个参数后才报错吗?之前能够成功reload?
  2. 你使用的用户 search 在以下目录有权限读写吗?

deploy_dir=/application/search/tidb/deploy/tikv-20160, data_dir=[/data1/tidb-data/tikv-20160], log_dir=/application/search/tidb/deploy/tikv-20160/log

你好,

看下中控服务器到 10.10.224.51,是否可以免密,并且 224.51 服务器的 .ssh目录权限744,authorized_keys文件权限600 也请反馈下,

可以看下这个帖子,看报错信息是 ssh 往 /tmp/drainer_c5a5d85c-e5dc-4952-a697-678ddae76010.service 中复制文件失败。

1.之前没有成功,第一次修改 2.目录都有权限

免密是好的,目录权限我重新调整为744和600了。中控机到其他机器都可以免密登陆,并可以sudo su -。 执行了reload 还是报错!

复制到/tmp文件 是什么操作?cp吗

ssh 连接,所以是 scp 操作。

search 用户下,执行该 scp 语句,看是否成功:
scp -P22 /application/search/.tiup/storage/cluster/clusters/tidb-young/config-cache/pump-10.10.21.159-8250.service search@10.10.21.159://tmp/pump_07ebeb93-a617-4ee6-83ac-9f0633441f86.service

这边测试,在免密情况下可以完成。

首次部署时,会生成一对专用的密钥为这个集群后续操作,密钥放在 (~/.tiup/storage/cluster/clusters/tidb-young/ssh/),你尝试使用这个密钥手动 scp 查看是否可以成功。

如果手动 scp 不成功,可能是远程机器的 ·authorized_keys· 里面的公钥被删除了。需要重新免密一下。

是将中控机上的~/.tiup/storage/cluster/clusters/tidb-young/ssh/id_rsa.pub 也拷贝到其他机器上吗? 首次部署的id_rsa.pub,后续不在使用了?

你好,先确认第一件事,使用 ~/.tiup/storage/cluster/clusters/tidb-young/ssh/ 该路径下的秘钥进行 scp 看是否成功。

如果是否在进行第二步:将中控机的 .pub 内容 append 到远程服务器的 authorized_keys 中。

可以传过去

你好,执行一下以下命令看能否成功:

tiup cluster exec tidb-yong --command="sudo echo success"

此外想问以下这个 reload 报错是稳定复现的吗?

已解决!@lonng 正解!感谢各位的帮忙

你好,

分享下解决的步骤,是否为重新免密解决

1.将中控机的(~/.tiup/storage/cluster/clusters/tidb-young/ssh/id_rsa.pub,tiup cluster list可以查到)拷贝到其他机器的.ssh/authorized_keys 2…ssh目录权限744,;authorized_keys权限600