创建cdc链路报错V7.5.3

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】v7.5.3
【复现路径】
pd节点正常运行且网络是通的
执行cdc创建命令后报错:
命令如下:
…/bin/cdc cli changefeed create --pd=http://xx.xx.21.233:2379 --sink-uri=“tidb://root:xxxx@xx .xx.21.133:4000” --changefeed-id=“xxxx-20241128” --start-ts 454224881147445286
【遇到的问题:问题现象及影响】
【资源配置】
【附件:截图/日志/监控】


pd不通?telnet检查下pd地址端口

看着是通的呀,–start-ts 后时间戳去掉试试呢?

–pd 改成 --server=http://<cdc_ip>:8300 这样试试看呢

pd 是通的 目前排查应该是之前扩缩容过pd节点后未reload集群 怀疑pd client未更新pd节点列表 等待reload后进行验证

是的 6.1 的时候官方文档命令是–pd, 6.5 以上是–server 有可能有这个问题

新版本推荐都用 --server 来指定了,可以不用纠结 --pd 这个参数,先改成 --server 试试看

不是命令的问题 ,已经确认是pd节点扩缩容后,没有reload集群
参考:https://docs.pingcap.com/zh/tidb/stable/scale-tidb-using-tiup#缩容-tidbpdtikv-节点

但是参照官网上的tiup cluster reload --skip-restart 只推送配置 不restart组件
执行后依然是创建链路失败
鉴于reload tidb server是有损业务的 ,我们采用了stop所有cdc节点 再start所有cdc节点,后续低峰期再reload整个集群的方案。
操作重启所有cdc节点后问题解决,创建链路成功。
单独重启一个cdc节点是没用的,创建链路失败。
原理应该是单独重启某个cdc节点,pd client不会重启,不能更新新的pd节点列表。
总结 pd节点扩缩容后,reload整个集群是必要的,官网的–skip-restart参数可能会产生非预期问题。

1 个赞