根据这两个截图,猜测可能是以下情况中的某一个导致的
- 上游 TiDB 有一个执行时间很长的事务,该事务会导致 TiCDC 无法推进 checkpoint。
- 上游 TiDB 执行了一个大事务,TiCDC 处理大事务的效率较低,在处理期间 TiCDC 无法推进 checkpoint。
- 上游 TiDB 或者 TiKV 出现了非预期宕机,导致有事务锁残留,残留锁也会导致 TiCDC 无法推进 checkpoint。
需要你们结合上游业务具体分析,如果是前两者则需要调整业务写入模式,尽量采用小事务写入,如果是最后一个需要提供更多的监控和日志做进一步分析。