使用TiUP cluster在单机上模拟生产环境部署报failed to start tikv

执行部署命令:
tiup cluster deploy tidb-test v4.0.2 ./topo.yaml --user root -p

启动集群报tikv failed to start:

检查tikv-20162 log日志有报错:

tiup-cluster-debug-2020-07-21-23-15-35.log (399.3 KB)

tikv 完整的报错日志以附件的形式上传下。

tikv.log (2.1 MB)

看下这个目录的权限和 tree,
/home/tidb/tidb-data/tikv-20162/

ls -lrt /home/tidb/tidb-data/tikv-20162
total 16
-rw-r–r-- 1 tidb tidb 14026 Jul 22 00:30 last_tikv.toml
-rw-r–r-- 1 tidb tidb 0 Jul 22 00:30 space_placeholder_file
-rw-r–r-- 1 tidb tidb 0 Jul 22 00:30 LOCK

tree /home/tidb/tidb-data/tikv-20162
/home/tidb/tidb-data/tikv-20162
├── last_tikv.toml
├── LOCK
└── space_placeholder_file

0 directories, 3 files

确认下,是否在 deploy 成功之后,没有对该 tikv 的 data dir 进行过手动编辑。

您好,整个部署过程中都没有对目录和文件做过任何操作的。

好的, 这边帮忙反馈下,有反馈这边会及时更新帖子。

请帮忙保护好现场,可以使用 tiup 重新 deploy 新的集群,保留报错集群

你的 tidb-data 目录是否有 x 权限呢?另外这个盘还有空间吗?

pwd
/home/tidb

ls -lrt
total 4
-rw-r–r--. 1 root root 1026 Jul 21 18:23 topo.yaml
drwxr-xr-x 11 tidb tidb 175 Jul 21 23:09 tidb-deploy
drwxr-xr-x 9 tidb tidb 138 Jul 21 23:09 tidb-data
drwxr-xr-x 2 root root 56 Jul 21 23:15 logs

好的,我会保护好环境,感谢您的支持。

还有1.7G空间

你好,

可否提供下 tikv log dir 下全部的日志呢。譬如 stderr 等。

你好,这边定位原因是,4.0 新增参数预留 2g 空间,避免 tikv 磁盘满了导致无法启动问题。但是当前磁盘剩余不足,导致 raft 目录没有被正确传创建。
对于 tikv log 我们已经着手做了改进,让报错信息更明确,
参数解释如下,
https://docs.pingcap.com/zh/tidb/stable/tikv-configuration-file#reserve-space

按您说的,换了个目录就可以了,非常感谢!

ok,有问题欢迎开新帖继续讨论

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。