使用Ansible方式升级至4.0.0版本后无法启动tikv

为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:
【 TiDB 使用环境】

【概述】使用Ansible方式,将TiDB集群从3.0.4版本升级到4.0.0版本后,启动集群是报错

【背景】

  1. 在未关闭3.0.4版本集群情况下,直接deploy 4.0.0版本的ansible
  2. 在提示部署成功后,使用ansible命令stop关闭集群,并成功停止
  3. 使用ansible命令,启动集群,提示tikv端口无法启动,如下所示:
  4. 查看tikv日志中发现有“cluster ID mismatch”提示,如下图所示:

【现象】数据库无法启动

【业务影响】

【TiDB 版本】4.0.0

【附件】

  1. TiUP Cluster Display 信息

  2. TiUP Cluster Edit Config 信息

  3. TiDB- Overview 监控

  • 对应模块日志(包含问题前后1小时日志)

若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

1 个赞

怎么操作的?
4.X 不是推荐使用 tiup 么?

确认一下 PD 的状态,是不是 PD 已经重置了。现在 TiKV 连接的目标 PD 然后 PD 集群发生变化。这个是非预期的情况,需要确认一下你们的升级步骤是否按照官方文档的提供的方式安装。

我是在现有的3.0版本升级到4.0版本,不是直接部署的4.0,所以没用TiUP

可能是由于我在未关闭集群时使用deploy命令导致。
后期我在run_tikv.sh中删除PD信息后,不再提示这个错误

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。