no valid relay sub directory exists

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】: tidb的版本:3.0.4 dm的版本:1.0.2
  • 【问题描述】: task同步中断,尝试了resume-task 和重启woker节点都无法恢复,帮忙看看如何处理

若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

是 dm 刚部署之后发现这个问题的吗 ? 看下 relay_log 下是否有目录以及文件。另外上游是否发生过 主从切换?

部署,运行了很长时间了,上游也没有发生过切换

可以检查下你上游 mysql 的 UUID 是否与该值匹配?

另外 提供一下 dm-worker 的日志,多取一些。

uuid是匹配的,因为我们上游是单实例,不涉及到主从切换

dm-worker_bak.zip (2.0 MB)

已经通过stop-task,start-task 把任务恢复了,谢谢

咨询了研发同学, 该报错主要原因是 syncer 开始读 relay 时报的错,所以 stop-task start-task 是有可能恢复正常的(开始读不到所需要的 relay log,后面又能读到了)。

好的,感谢

:+1::+1:t3::+1:t6:

遇到过两种情况,供大家参考

  1. relay log正常,报上面的错,可以stop-task/start-task恢复
  2. worker异常,被踢出slave,可以在上游“show slave hosts"查看,通过重启worker恢复

:+1:感谢分享