DM同步诡异问题求问:个别表复制不同步了,但任务状态正常,大多数表还在同步

【TiDB 使用环境】生产环境
【TiDB 版本】集群 7.5.5 ,DM v7.5.5
【操作系统】Ubuntu
【部署方式】阿里云 ECS 集群)

【问题表现】

  1. 上下游数据不一致,表现是个别表复制停滞,如图是 count() 对不上
  2. 查看 dmmeta 数据,updatetime 停留在较早之前,且 binlog_name 字段也和正常的不一样
  3. 该表是正常配置在同步规则内的


4. 目前查出来的都是些低频更新的表,并且最新停留日在 0703 我们那天有操作过在上游 mysql 做了 reset master 的操作。高度怀疑跟这个有关,但是在测试环境没复现……

看看worker日志有报错嘛

1 个赞

updatetime时间对不上,就应该是出问题了,那个时间点

没翻到。都是些低频的表,今天还故意找了一张一直没更新过的来复现,确实不同步了。

解决了老大,我好像也遇到了。是怎样解决的,谢谢了

复现了以后,日志里面也是没有任何异常嘛?

如果说日志上都看不出问题,就很难定位了。

怎么解决的?分享一下。

日志也没找到相关的迹象。只是在生产上发现有些表是这样,但是无法在测试环境复现出来。

1 个赞

没解决。现在只是把明确有这些问题的表,给重新支持同步了

更新一下:

  1. 目前没找到根因、没法解决这个隐患
  2. 就是找到这些表,因为都是低频表,直接确认一下上下游是同步正常的,然后删掉dmmeta 的syncer_checkpoint 表里面这些表的meta行数据,等下次自动重新同步(或者自己模拟一下插入新数据)即可
1 个赞

阿里云的ECS集群怎样?准备把公司的vm停了上云