Lightning中报错,然后import节点处于假死状态

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】:v2.1.8
  • 【问题描述】:在用lightning导入114G数据的时候,执行到后续阶段报错,且import(tikv)节点处于假死状态。日志:image 。请问这种情况该怎么解决呢,已经第二次发生了。

若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

看一下 lightning/importer 监控项,另外确认是导入 100 多 GB 文件用了 6 个小时吗?

image

image 是的

从 lighting 日志中看到 info schema out of date ;这个错误是指 tikv 在指定 lease 之内没有响应 tidb 的 schema 查询请求,当时 tikv 集群可能比较繁忙。
另外 2.1.18 版本中 tikv raft store & apply cpu 为单线程,建议用 3.0 测试,相比 2.1 相关两个线程已经调整为多线程
以及刚才楼主另一个帖子里的信息,机器配置是 32G + 16U ;大概是 5 * tikv + lighting + import 混部、楼主可以再补充下机器磁盘 iops 的能力。

lightning 的正常加载速度为 200~300GB/h 左右,最低配置要求请参考官网文档: