CDC 无法快速的定位问题

需求反馈
请清晰准确地描述问题场景、需求行为及背景信息,更有利于产品同学及时跟进需求
【需求涉及的问题场景】
需求来源: 生产cdc同步异常,提示CDC:ErrMySQLTxnError]Error 8021,在线等~。。 - #8,来自 xmlianfeng

CDC在建立同步时,并不是按照一张一张的表去建立的,而且采用的混合模式 (多张表一起)
这个场景很常见,但是出现同步错误时,给出的信息无法准确的做出判断和定位,需要这个Region 范围所有的 Key 进行排查,工作量太大了
例如:

[2021/11/27 10:18:14.705 +08:00] [INFO] [client.go:868] [“start new request”] [request="{“header”:{“cluster_id”:6964287679291523214,“ticdc_version”:“5.0.3”},“region_id”:9127449,“region_epoch”:{“conf_ver”:119,“version”:21489},“checkpoint_ts”:429386495940362258,“start_key”:“dIAAAAAAAMH/RF9yAAAAAAD6”,“end_key”:“dIAAAAAAAMH/RF9ygAAAAAD/Cv1lAAAAAAD6”,“request_id”:120051,“extra_op”:1,“Request”:null}"] [addr=172.19.16.199:20160]
[2021/11/27 10:18:14.802 +08:00] [ERROR] [processor.go:1399] [“error on running processor”] [capture=172.19.16.189:8300] [changefeed=hk-to-idc-tidb] [processor=52dc1fd5-75a4-43dd-a095-3171dc2b3da1] [error="[CDC:ErrMySQLTxnError]Error 8021: inconsistent extra index PRIMARY, handle 14 not found in table"] [errorVerbose="[CDC:ErrMySQLTxnError]Error 8021: inconsistent extra index PRIMARY, handle 14 not found in table

我让用户查阅Region 对应的表信息如下:

【期望的需求行为】

  1. 有更清晰的问题描述

  2. 能够描述支持问题解决(跳过同步,手动同步,强制同步等等)

【需求可替代方案】
暂无

【背景信息】
对于 CDC 的问题定位和描述提出了更高的要求,但是问题的排查会更加方便和清晰,惠及目前正在使用CDC的用户,以及潜在用户

Error 8021 看起来是下游 TiDB 返回的报错,意思是当向 TiKV 读取的 key 不存在,这个报错并不常见,可能下游集群因为一些 bug 导致事务写入的部分 Key 数据丢失。