ticdc从指定TS同步数据日志异常

【 TiDB 使用环境】生产环境
【 TiDB 版本】v4.0.9
【复现路径】做过哪些操作出现的问题
老TIDB集群性能很弱(普通的sata盘,IO挺高的,还有在跑tidb组件外的服务,压力也不小),现用新集群部署一套同版本v4.0.9的集群,同步数据。
1,先用br restore全量数据到新集群
2,再用ticdc 根据全量数据的TS追加同步数据
【遇到的问题:问题现象及影响】
ticdc日志中很多异常的Waring日志,想问下这是啥意思,有没有什么影响 ?

PS:
我们的数据量:全量数据大概有4T *3副本=12T左右。
我们是每月1号全量备份数据,从1号到现在13号需要追加的数据量也有100G左右,这个需要追加的数据量太大有没有啥影响呢?

【附件:截图/日志/监控】

看task状态,state一直是normal,但checkpoint一直没变化,是在等追加的数据导出吗?需要等计算完需要追加的数据才开始写入新库是这个逻辑吗?

性能不够吗 cdc 也需要多借点

1 个赞

2个cdc节点,都是256g,48core的新服务器

好多这些Warn的日志,看不懂啥意思,但task状态又是normal。
现在这个ticdc的数据目录有130G了,为啥 会这么大啊?

新服务器性能是够用的, 老集群的性能是挺低的,压力也挺大。
难道是老集群的性能问题? 能确定这些日志是正常的可以忽略的吗?

这是正常现象,cdc 在同步数据的时候会把增量数据拉到本地处理下,再同步到下游。
TiCDC 架构设计与原理 | PingCAP 文档中心

1 个赞

一般来说,没出现ERROR 异常情况,可以先不处理,多观察一段时间再看看

1 个赞

好的,我观察一下,多谢回答~

还有个问题请教下:TICDC是不支持数据库级别的同步是吧? 没找到相关参数

我们备份是基于库的备份,不同库的备份时间不同,恢复的时候也不同, 但我在用ticdc的时候指定的TSO是最早的库的备份,这样操作,其他的库数据会不会重复,或者有啥问题吗?

  1. 支持库基本的同步,可以利用 filter rule 指定 changefeed 需要进行同步的库。建议每个同步任务同步的表的数量不要超过1000 张。
  2. 同步进度一直卡主不动是因为有 100GB 的存量数据需要先拉过来,才能进行同步。
  3. TiCDC 目录下的文件已经超过 130GB 是因为需要把拉过来的数据进行排序。
  4. 这个增量数据太大是否有影响:是的,增量数据太大可能会让同步任务在初始化完毕之后卡住很长一段时间。
2 个赞