一直有这个告警,ticdc_memory_abnormal

【 TiDB 使用环境】生产环境
4013
【复现路径】做过哪些操作出现的问题

【遇到的问题:问题现象及影响】
内存还剩好多,查了一下这个告警意思是TiCDC 堆内存使用量超过 10 GiB。有啥意义吗,我的cdc服务器内存62G,用了32G,能不能把这个告警值调大,有啥风险吗

补充一下日志也没有看到啥异常

没啥意义,可以调大 :grinning:

你们都设置的的多少,是不是只要服务器内存够用,都可以调大告警

告警没啥意义的,只要实际上不超出内存使用就可以

去prometheus下面有配置文件tidb-deploy/prometheus-8249/conf 修改告警规则

是的,不OOM就可以

贴日志看看

以下是一些可能导致"ticdc_memory_abnormal"告警的原因:

  1. TiCDC 运行时内存设置不足,无法满足大规模变更数据的转换和传输需求。
  2. TiCDC 监听的数据库变化太多,处理能力有限。
  3. TiCDC 存在内存泄漏或其他内存管理问题。

以下是一些可能的解决方案:

  1. 增加 TiCDC 运行时的内存配额,以提高 TiCDC 处理变更数据的能力。
  2. 调整 TiCDC 的数据抓取范围和频率,以减少 TiCDC 的内存负担,确保 TiCDC 更好地处理变更数据。
  3. 检查 TiCDC 的日志,识别可能的内存问题和瓶颈,并尝试修改 TiCDC 的配置或解决器问题。
  4. 更新 TiCDC 到最新版本,以利用最新的优化和更新。

"ticdc_memory_abnormal"告警需要注意 TiCDC 的内存使用情况,并通过检查 TiCDC 的日志和配置,适当调整 TiCDC 运行时的参数,以确保 TiCDC 的稳定和准确性。


去配置文件tidb-deploy/prometheus-8249/conf改报警规则吧