tidb由4.0 升级 为5.2 drainer 启动报错,其他组件都正常运行,仅drainer 启动报错,提示 [error="rpc error: code = Unknown desc = cluster ID are mismatch, 0 vs 6828074581048291032"]

为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:
【 TiDB 使用环境】
【概述】tidb由4.0省级为5.2 drainer 启动报错,提示 [error=“rpc error: code = Unknown desc = cluster ID are mismatch, 0 vs 6828074581048291032”]

错误日志为:

【背景】做过哪些操作
【现象】业务和数据库现象
【业务影响】
【TiDB 版本】
【附件】

  1. TiUP Cluster Display 信息

  2. TiUP Cluster Edit Config 信息

  3. TiDB- Overview 监控

  • 对应模块日志(包含问题前后1小时日志)

升级成功了没?

没成功,就参考以下这个:

由于 Drainer 启动服务的时间较长导致,Tiup 等待时间过长报错,截止到 v5.0.1 的版本 tiup cluster 的 wait_timeout 默认 120s 。该问题同样适用于 tiup start 、restart 、reload 等操作。

tiup cluster upgrade --wait-timeout 600
tiup cluster start --wait-timeout 600
tiup cluster restart --wait-timeout 600
tiup cluster reload --wait-timeout 600

升级成功了,但是报
cluster ID are mismatch, 0 vs 6828074581048291032
说我的 cluster ID 不一致

感觉是 drainer 记录的集群标识和现在的不一致,可以参考下这个帖子,做个修复

1 个赞

我们是生产环境,这么修复会不会丢失数据?

还有一种方案,就是选择把 drainer 全部缩容掉,然后重新在扩

这个修复是针对 drainer 的,对 PD ,tidb,tikv 没啥影响了

具体的需要你自己来评估一下

感谢!!或者是我直接重新部署一个 drainer 是否可行?
同时方便提供下 tiup 扩缩容 drainer 的操作步骤吗?

https://docs.pingcap.com/zh/tidb/stable/binlog-control

可以先下线,然后在重新部署一套好了

https://docs.pingcap.com/zh/tidb/stable/deploy-tidb-binlog

可以收集下现在 binlog 这块的配置信息,免得再来一遍了