你在使用TiCDC时踩过什么坑,线上使用有何[最佳实践]建议?

我生产遇到过一次问题,有个集群cdc大概3000+的tps(主要是插入),同步到下游kafka。
下游的kafka磁盘io满了,cdc进程就卡住了,不同步也不报错,还好我写了个监控脚本,定时监控同步时间误差,修复好下游kafka后cdc任务还是处于卡住状态。重启了cdc服务后恢复正常。

2 个赞