使用tidb用户部署集群时,init后启动集群报错。疑似bug

【 TiDB 使用环境】生产环境 /测试/ Poc
poc
【 TiDB 版本】
tidb v8.5.1
tiup 版本:

【复现路径】做过哪些操作出现的问题
使用tidb用户部署集群后,执行init初始化集群报错:


然后在pd日志中查看问题如下:

查看部署的路径如下:

这里出现了deploy路径为tidb权限。其他路径为root权限。正常情况部署集群,生成的文件路径所属权限应该都是tidb用户。

使用的部署集群拓扑文件如下:

【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
使用arm64的版本

【附件:截图/日志/监控】

:thinking:执行的部署命令是怎么样的?

tiup cluster deploy tidb-test v8.5.1 ./topology.yaml
使用这种方式。
换句话说不管哪种方式是不是路径的所属权限都应该是一个用户。

:joy:说实话,没关注过。但是如果做了tidb用户的免密登录,应该权限是和root等价的。
我主要想看看是用什么用户执行的这个命令,cmd里看不到了么?


这个是tiup的执行日志
tiup-cluster-debug-2025-01-21-09-56-55.log (146.3 KB)

这个是启动集群命令,不是部署集群命令。

部署命令是这个。
tiup cluster deploy tidb-test v8.5.1 ./topology.yaml --user root [-p] [-i /home/root/.ssh/gcp_rsa]

就是使用的这个。tiup cluster deploy tidb-test v8.5.1 ./topology.yaml

tiup日志没有这个部署的日志。也不知道怎么回事。 :sweat_smile:

tiup cluster deploy tidb-test v8.5.1 ./topology.yaml --user=root -p试试

tidb-data的权限不对,使用
chown -R tidb:tidb /data1/tidb-data,然后在尝试启动

“tiup cluster deploy tidb-test v8.5.1 ./topology.yaml” 执行的用户
跟 “ topology.yaml 中的 global user: tidb ” 的用户要保持一致。

有没有从安装部署开始的日志和操作记录?感觉还是权限或者执行操作的用户没有配置对

解决这问题好处理,我主要是反馈这种现象。感觉是bug呢

嗯嗯,我也这么处理的。解决这问题好处理,我主要是反馈这种现象。感觉是bug呢

tiup没有部署的日志,有check的日志和init的日志就是没有deploy的日志

是的,保持一致了


deploy.yaml文件中user写的是root,执行tiup安装的用户是tidb,最终tidb-deploy跟tidb-data目录都是root,可以看出部署目录的权限是根据deploy.yaml中的user来决定的。

1 个赞

PD的248:2379 没起来 ,目录权限检查下 有问题