使用lightning导入数据报错

为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:

【TiDB 版本】
v4.0.6
【问题描述】
使用lightning的local模式导入到一定时间后提示报错,kv节点down且提示有文件缺失,lightning命令执行后期间未做任何操作。曾试过重新导入,实验证明该问题是必定复现,无法通过重新导入解决。


链接: 百度网盘-链接不存在 密码: udta
所有机器日志

建议使用新的 Lightning 工具试一下,可能是 Lightning 导入的一个 bug。

工具版本的话之前也是换过几次了,我现在先试试把所有数据全删除再重来一次吧


您好,重新导入了一晚上,还是会出现相同错误
lightning工具试过4.0.6,4.0.12,和5.0.1都试过了

你好,我梳理下,当前集群版本是 4.0.6 对吧,麻烦提供下 lightning 工具版本为 4.0.12 时的日志吧。

另外我看你这边描述说是问题必现,请问 tikv 状态显示 down 后,做了什么操作,start 可以正常起来吗?

您好,我在一楼提供的日志就是4.0.12版本时执行的,
tikv显示down之后没有做任何操作,因为数据库都已经无法访问了,start不能起来,因为日志显示有sst文件缺失

好的,再次确认下,你这个必定复现,是部署了多套集群去复现的吗 ?

另外我看日志里面没有提供 lightning 的相关内容,麻烦提供下 4.0.12 lightning 的配置文件以及日志。多谢。
image

您好,使用4.0.12版本lightning导入过程日志如下
tidb-lightning.log 2.zip (4.1 MB)
复现没有部署多套集群,是出错后clean掉集群数据重新导入

你好,测试环境的话,是否方便使用 4.0.12 的 TiDB 集群操作呢,我们这边同步看下日志。

原数据是从4.0.6版本导出的,意思是新建一个4.0.12版本的集群,然后用4.0.12版本的lightning导入?

是的,你把数据搞到 4.0.12 集群上看看能不能恢复成功

:yum: 还有一个问题哈,lightning 这边提供的日志是 2021/05/16 17:43 开始的,但是 tikv 日志是 2021/05/16 07:44:53.847 -04:00 结束的,时间上对不上哈。


建议你这边使用 4.0.12 集群导入数据看下,如果仍然报错,辛苦再次提供下日志,时间要保持一致哈。

好,我尝试一下搭建4.0.12版本集群导入

关于时间,因为执行lightning的机器是另外一台单独的机器,没有参与到tidb集群中,所以时间不一致,我想这应该不是主要问题

方便的话,建议时间保持一致,或者请告知两台机器时差哈。


左侧为执行lightning进程的机器时间,右侧为tidb集群时间,tidb集群时间是正常的

建议把时间更改成一样的,现在相差的并不是整数点时间,不方便对比。

这边部署 4.0.12 后,看下导入情况吧,如果有问题,再重新拿一下相关日志以及信息,感谢。

今日早上起来,发现导入报错,由于本次导入参考了https://asktug.com/t/topic/32914/5相关内容,给tikv的sync-logs参数配置为true,上次的缺少sst的报错便没再出现

本次导入为了尽快发现问题,没有全量数据导入,只导入了一个较大的库

另外昨天导入的时候由于怕中途改时间报错,所以还没调lightning机器的时间,其时差如上所示,大约差4个小时

相关日志如下
链接: https://pan.baidu.com/s/18GapMTOMPon3vuHV5aINeg 密码: kgro

tidb-lightning 的配置文件也提供一下吧。

另外当前的 display 拓扑麻烦提供一下,多谢。

当前拓扑状态:


toml:
tidb-lightning.toml (870 字节)