CDC 现在是按照表的数量来进行负载均衡调度的,而不是根据表的流量进行负载均衡调度。因此当流量大的表被调度在 owner 节点的时候,owner 节点的资源消耗可能就会比较高。
另外一点,管理 changefeed ,并且对每个 changfeed 都维护一个 schemaStorage 是比较消耗内存的。
关于 v5.4.1 表调度的代码主逻辑在这里:https://github.com/pingcap/tiflow/blob/v5.4.1/cdc/owner/scheduler_v1.go#L71
关于 v5.4.1 owner 需要维护的 schemaStorage 的逻辑在这里:
https://github.com/pingcap/tiflow/blob/v5.4.1/cdc/owner/schema.go#L49