tidb由4.0 升级为5.2 drainer 启动报错，其他组件都正常运行，仅drainer 启动报错，提示 [error="rpc error: code = Unknown desc = cluster ID are mismatch, 0 vs 6828074581048291032"]

Hacker_UgvRw9pn · 2022 年3 月 21 日 15:32

为提高效率，请提供以下信息，问题描述清晰能够更快得到解决：
【 TiDB 使用环境】
【概述】tidb由4.0省级为5.2 drainer 启动报错，提示 [error=“rpc error: code = Unknown desc = cluster ID are mismatch, 0 vs 6828074581048291032”]

错误日志为：

【背景】做过哪些操作
【现象】业务和数据库现象
【业务影响】
【TiDB 版本】
【附件】

相关日志和监控

TiUP Cluster Display 信息
TiUP Cluster Edit Config 信息
TiDB- Overview 监控

对应模块日志（包含问题前后1小时日志）

xfworld · 2022 年3 月 22 日 01:09

升级成功了没？

没成功，就参考以下这个：

由于 Drainer 启动服务的时间较长导致，Tiup 等待时间过长报错，截止到 v5.0.1 的版本 tiup cluster 的 wait_timeout 默认 120s 。该问题同样适用于 tiup start 、restart 、reload 等操作。

tiup cluster upgrade --wait-timeout 600
tiup cluster start --wait-timeout 600
tiup cluster restart --wait-timeout 600
tiup cluster reload --wait-timeout 600

Hacker_UgvRw9pn · 2022 年3 月 22 日 02:00

升级成功了，但是报
cluster ID are mismatch, 0 vs 6828074581048291032
说我的 cluster ID 不一致

xfworld · 2022 年3 月 22 日 02:13

感觉是 drainer 记录的集群标识和现在的不一致，可以参考下这个帖子，做个修复

Hacker_UgvRw9pn · 2022 年3 月 22 日 02:20

我们是生产环境，这么修复会不会丢失数据？

xfworld · 2022 年3 月 22 日 02:23

还有一种方案，就是选择把 drainer 全部缩容掉，然后重新在扩

这个修复是针对 drainer 的，对 PD ，tidb，tikv 没啥影响了

具体的需要你自己来评估一下

Hacker_UgvRw9pn · 2022 年3 月 22 日 02:45

感谢！！或者是我直接重新部署一个 drainer 是否可行？
同时方便提供下 tiup 扩缩容 drainer 的操作步骤吗？

xfworld · 2022 年3 月 22 日 03:03

https://docs.pingcap.com/zh/tidb/stable/binlog-control

可以先下线，然后在重新部署一套好了

https://docs.pingcap.com/zh/tidb/stable/deploy-tidb-binlog

可以收集下现在 binlog 这块的配置信息，免得再来一遍了

tidb由4.0 升级 为5.2 drainer 启动报错，其他组件都正常运行，仅drainer 启动报错，提示 [error="rpc error: code = Unknown desc = cluster ID are mismatch, 0 vs 6828074581048291032"]

tidb由4.0 升级为5.2 drainer 启动报错，其他组件都正常运行，仅drainer 启动报错，提示 [error="rpc error: code = Unknown desc = cluster ID are mismatch, 0 vs 6828074581048291032"]