现象:集群中drainer组件经常性down掉,且难以重启恢复。
排查:error日志附近出现“receive big size binlog”的字样,binlog的大小在100MB+,在论坛中看到相似的问题,参见《
上游sql通过drainer同步到kafka时在kafka中是什么样子的 - qhd2004 的专栏 - 专栏 - 上游sql通过drainer同步到kafka时在kafka中是什么样子的 | TiDB 社区
》中的结论3。
其他:drainer和pump为默认配置。
咨询:处理此类问题的策略或建议?能够统一的解决这个问题,或者能够使得drainer不会经常性异常退出。