TiCDC changefeed在tikv节点disconnect后无法自动恢复

为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:


若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

2 个赞

麻烦描述一下,tikv 的 disconnected 的原因是什么 ?另外如果 tikv 没有正常下线,还有数据需要从该节点拉取,是会重试的。所以旧节点是什么 TiKV disconnected 节点吗?

1 个赞

:ok_hand:,这个我们这边反馈一下(不过建议走正常的 维护流程,主动先关闭这个 tikv )

这个我们确认了,当前这个重试的次数,曾经监听的 region 数成正比,监控上显示 2317 个,日志中重试了 1779 次,如果不 stop changefeed 的话,应该过一会就没有重试了,会进行切换的。(这个后续会改进)

嗯,这个后续,产品会改进的

遇到了同样了问题,这是 cdc grpc 连接池的 bug,在高版本已经修复,修复问题的 pr:

https://github.com/pingcap/ticdc/pull/1196

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。