Lighting日志中transport is closing,请问怎么解决呢?

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】:v2.1.8
  • 【问题描述】:tidb-lighting工作进行一段时间后,日志中报错close write stream cause failed : rpc error: code = Unavailable desc = transport is closing。

若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

请上传下 lightning 和 importer 的日志,另外 lightning 的版本是什么?

tidb_lightning.log (3.4 MB) tikv_importer.log (281.6 KB)

文件是相关时间段内lighting和importer的日志。lighting的版本是2.1.8

请再帮忙看下 lightning 报错的时间段连接的下游的 tidb 有相关报错吗?

tidb.log (3.6 MB) tidb2.log (2.3 MB)

附件是对应时间段tidb的日志,Unknown database ‘web_ods_valid’ 这个是我们有程序在线,但是这个库已经删除了。
一个文件太大,就拆成俩文件。

lightning.log 报错时,是 14:26 左右,此时 importer 已经挂掉了,所以 lightning.log 出现了上述报错:

那importer为什么会掉呢?还有断点续传功能貌似也没有用到

  1. 是说 importer 出现了无故挂掉的情况是吗?从日志看14:25 分左右的时候 import 是正常的,但是在 15:07 手动重启了 importer ?

  2. 你那里说没有用到断点续传的功能是说每次重启 importer 和 lightning 后,又开始全量导入了吗?设置断点续传功能了吗?

https://pingcap.com/docs-cn/stable/reference/tools/tidb-lightning/checkpoints/

1.是这样,14.25分,importer挂掉了,但是我们没注意到,到3点的时候看见,然后就启动了importer 。
2.重启importer之后,又 执行了一次start_lighting,准备通过断点续传的功能继续录数据, 但是失败了,报错是


3.设置断点续传了,您看看这个
image

有 importer_stderr 类似日志文件吗?如果有请提供下吧~~~

importer_stderr 文件里面没有内容。

操作系统的日志以及 dmesg -T|grep -i oom 看下结果

操作系统的日志是指哪个呢?

看日志是 importer 因为 oom 被 kill 了,请从这个方向再检查下吧

好的,非常感谢:handshake:

:+1::+1::+1:

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。