场景是这样:
我这里有5个IP的mysql数据库 和 10个IP的mysql数据库
一共15个源
其中 5个IP的mysql数据库中,做了分库分表,每个IP上面10个分库10个分表, 一共50个分库50个分表
其中10个IP的mysql数据库中,也做了分库分表,每个IP上面10个分库10个分表,一共100个分库,100个分表
我现在要做分库分表的实时同步,使用TIDB DM工具。
其中 50个分库50个分表那个, 我一共配置了17个同步任务, 每张表对应一个配置文件
100个分库100个分表的那个, 我配置了9个同步任务,每张表对应一个配置文件
昨天下午18:00的时候,一切都是好的。 在 DM可视化监控界面上,可以看到运行中的任务数 175个
然后今天凌晨1点左右收到了告警, 具体看了一下, 是某一个任务, binlog同步落后了
今天白天的时候,反复搞,最终发现, 我把任务停止后, 要再次启动,就非常困难了。 大概只能启动60个任务, 之后就会提示 RawCause: context deadline exceeded"
重新启动那个binlog落后的任务, 我看worker日志里,也是有出现 RawCause: context deadline exceeded"的字眼