TiDB binlog 数据同步,drainer 拉去 pump 组件的数据时异常,导致数据不一致问题?

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】:
  • 【问题描述】:
    根据文档描述,pump 组件 crash 时,将其状态置为 offline 会丢失该节点的数据。
    drainer 拉去数据之后进行排序,如果 pump 暂停、或者网络延迟、没有拉去到 pump 1的数据,pump 2、3 的数据拉去之后、合并排序,发送给下游。pump1 恢复之后,又拉取到了 pump1 的数据。合并时发现最小的 事务小于已经提交发送到下游的事务。就会导致数据不一致?

若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

Pump未offline的話是不會推進commit TS的。所以不存在「pump1只是暫停, 沒拉到pump1->拉到pump2&3就合併排序發送給下游」的。

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。