TICDC的BUG,大小写问题,希望官方的大大诊断一下呢

【TiDB 使用环境】生产环境
【TiDB 版本】
【操作系统】欧拉
【部署方式】私有云
【集群数据量】10亿+
【集群节点数】42
【问题复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
下午好,请教一个问题,TICDC的捕获数据时,数据表的表结构是CHAR(36) + utf8mb4_0900_ai_ci(大小写不敏感),在对数据进行变更时,如果id值是小写,则不会抓取,如果是大写则会。
例:3023ef8f-88d3-4831-80fc-6206b597c65f 这一行的变更不会被抓取,而58BAA954-1C47-4F73-BD89-C4A24CD22CD1这一行的就会。
我需要做一些什么吗?或者这可以确认是一个BUG?

我发现有些小写的也是可以抓取的,可能是其它问题,我自己先排查一下。

升级 TICDC 到 v6.5.0+ /v7.1.0+ 稳定版试试看吧

怎么会有这种问题呢,我在我们系统里面试了一下是正常了,是不是有业务代码处理过呀

TiCDC 通过拉取 TiKV(TiDB 的分布式存储引擎)的变更日志(KV Change Logs),实时捕获上游数据库的所有数据变更(包括 DML 和 DDL)

看官方怎么回答

1 个赞

这么奇怪的问题最后确定是什么原因导致的了吗?

3 个赞

这个是哦,按说应该都抓取才对。

2 个赞

大小写敏感?

3 个赞

看官方大大回复,也许有大小写相关的变动

3 个赞

怎么会有这种问题呢,是不是有啥策略

3 个赞

可能是TiCDC 在 数据识别、索引处理或字符集 / 排序规则适配 上的缺陷

2 个赞

是不是CDC有参数没有配置好啊

2 个赞

大小写敏感了?

2 个赞

感觉你这个配置的问题呀

2 个赞

TiCDC 对「大小写不敏感排序规则(utf8mb4_0900_ai_ci)」的适配缺陷 ,不算业务代码或参数配置问题

1 个赞

建议用utf8mb4_bin

没遇到过这个,配置可以发一下吗