cdc 同步binlog 到kakfa 没数据

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】:v4.0.8
  • 【问题描述】:kafka没数据

集群架构

1: 创建同步任务

2:配置文件

3:查询同步任务列表

%E5%9B%BE%E7%89%87

4: 查询特定同步任务

5:cdc_stderr.log

6:cdc.log

你好,
正在分析, 有进展随时更新帖子. 感谢反馈

更新了配置文件,加了库表过滤就可以了

2个日志

cdc.log (818.4 KB)
cdc_stderr.log (35.5 KB)

收到, 非常感谢你的反馈, 我们分析下~

昨天开始同步数据的那个任务binlog-test,早上发现又不能同步了。chkpoint 卡在 2020-11-05 23:42:37.337。今天早上重新部署了一个任务binlog-bth,也一直没数据同步到kafka

你好,

新的问题出现的时间点和对应的日志发下,

./cdc cli changefeed query --pd=http://172.18.115.34:2379 --changefeed-id=“binlog-bth”

changefeed query.txt (24.0 KB)

cdc.log 如下:

cdc_stderr.log 几百兆的日志

cdc.log 2020-11-05 23:40

20201105-23.log (693.1 KB)

收到, 这边有进展会及时更新帖子

cdc 有没有什么优化内存的方法? 开了4个 changefeed 任务,内存23G。

请问 binlog-bth 这个任务同步了多少张表,从日志来看可能是同步的表数量过多,导致存储 etcd 时候的 kv size 超过了默认的 GRPC 最大值,所以这个任务被暂停了

2个库,一共 202 张表

但是昨晚同步的 binlog-test 这个任务也是2个库,表一样的。但是可以同步数据

200 张表不应该有问题。可以 dump 一份 etcd 的数据信息我们来定位下问题么

ETCDCTL_API=3 etcdctl --endpoints=http://172.18.115.34:2379 get /tidb/cdc --prefix > etcd.log

在pd 主节点执行这个吗

在这个目录用 ./etcdctl 执行?