dmctl handle-error skip 非 DDL 错误时,返回消息不正确

Bug 反馈
清晰准确地描述您发现的问题,提供任何可能复现问题的步骤有助于研发同学及时处理问题
【 Bug 的影响】

对使用无太大影响,属于提示信息错误。但如果根据返回信息判断处理结果,可能会误判。

【可能的问题复现步骤】

从下图可以看出,thc_1040_ihc5111 迁移任务明显出错了,而且并非 DDL 兼容性导致的错误,这时使用 skip 是无法跳过的,请看后续截图。


【看到的非预期行为】

执行 dmctl --master-addr <ADDR> handle-error thc_1040_ihc5111 skip 命令,可以看到返回的 msg 是 “has no error”,但这个迁移任务明显是有错的,上图即可证明。这个消息,跟 skip 一个状态为 Running 的正常迁移任务是完全一致的,显然是不对的。


【期望看到的行为】

类似这样的消息,才是符合预期的。当然,这只是一个示例,官方可以根据自己的错误类定义具体指定。


【相关组件及具体版本】

DM 集群版本: v2.0.7
dmctl 版本: v2.0.7

【其他背景信息或者截图】
如集群拓扑,系统和内核版本,应用 app 信息等;如果问题跟 SQL 有关,请提供 SQL 语句和相关表的 Schema 信息;如果节点日志存在关键报错,请提供相关节点的日志内容或文件;如果一些业务敏感信息不便提供,请留下联系方式,我们与您私下沟通。

1赞

感谢反馈。DM 目前在遇到图中 GTID 同步错误时会尝试自动恢复任务,可能是 handle-error 时 DM 已经把任务启动了,正在初始化,所以报错信息比较误导

下个版本我们会在 GTID 同步错误时不要恢复任务,因为即使自动恢复还是会报错

1赞

收到。

1赞