使用spark streaming的时候历史数据怎么处理

zhengyunpeng · 2019 年8 月 16 日 03:57

使用spark streaming的时候历史数据怎么处理
目前使用tidb binlog将增量数据发送到kafka，然后使用kafka将数据接入到spark streaming，历史数据怎么办？
数据是由线上mysql使用dm同步过来的。

zzzzzz · 2019 年8 月 16 日 07:32

历史数据需要做 job 全量捞一份的。

可以显示的指定 tso 号来配合后面的 streaming 的操作。

zhengyunpeng · 2019 年8 月 16 日 07:32

好的，谢谢

system · 2022 年10 月 31 日 19:03

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。