【 TiDB 使用环境`】测试环境
【 TiDB 版本】5.3.1.0
【遇到的问题】ticdc blob字段值传输到kafka topic中的值存在差异
例如:手动读取blob字段值写入kafka topic中 消费topic该值为 “3Amp(” ticdc 同步到kafka的数据消费出来是"3Am<87>p(" 所以请教下 这种情况发生的原因。
请问您用 ticdc 同步的时候,设置的 protocol 是什么?
default 和 canal-json都是一样的结果
您好,canal-json 是经过序列化的协议,可能对 blob 类型字段显示不友好,可以尝试使用 open-protocol 来处理 blob 字段和序列化 string 类型字段。
[quote=“Min_Chen, post:5, topic:872918”]
open-protocol
[/quote]您好 open-protocol 我们也试过 结果是一样的 也是存在<>脏数据的情况
也不能算是脏数据吧,就是显示的问题,麻烦将 blob 字段内容按 16 进制打印出来,然后与数据库中字段 16 进制显示的做对比,看是否一致。
我们测试人员对比了 两种不同数据的16进制的数据不一样