cdc消耗大量内存

为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:
【 TiDB 使用环境】
生产-数仓

【概述】 场景 + 问题概述
五台64g cdc 其中两台内存使用过高oom 导致cdc服务一直重启 同步任务延迟,我把他们扩容到128g 居然内存要用到100g+,也出现了oom
【备份和数据迁移策略逻辑】

【背景】 做过哪些操作

【现象】 业务和数据库现象

【问题】 当前遇到的问题

【业务影响】
业务受到严重影响 无法同步数据
【TiDB 版本】
4.0.15
【附件】

  • 相关日志、配置文件、Grafana 监控(https://metricstool.pingcap.com/)
  • TiUP Cluster Display 信息
  • TiUP CLuster Edit config 信息
  • TiDB-Overview 监控
  • 对应模块的 Grafana 监控(如有 BR、TiDB-binlog、TiCDC 等)
  • 对应模块日志(包含问题前后 1 小时日志)

若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

上面的问题,确认下下述信息:

  1. 当前 cdc server 是独占服务器部署,还是混合部署
  2. 当前 cdc 一共有多少个 changefeed,并且每一个 changefeed 同步的表的数量有多少个
  3. cdc 的下游是 kafka 还是 mysql 或 tidb,以及在 cdc server oom 前,下游消费数据是否有出现延时升高的情况
  4. 导出 cdc oom 时间点前后 1 小时的 grafana 监控,导出方法见:
    [FAQ] Grafana Metrics 页面的导出和导入