Tidbv2.1.1升级到v3.0.1版本

为提高效率,提问时请尽量提供详细背景信息,问题描述清晰可优先响应。以下信息点请尽量提供:

  • 系统版本 & kernel 版本】 centos7
  • TiDB 版本】 tidb v2.1.1
  • 磁盘型号】 固态硬盘
  • 集群节点分布】 2tidb+3pd+3tikv
  • 数据量 & region 数量 & 副本数】 1副本
  • 问题描述(我做了什么)】 升级过程中检测服务状态失败

在升级步骤中https://pingcap.com/docs-cn/v2.1/how-to/upgrade/from-previous-version/

执行 ansible-playbook excessive_rolling_update.yml

如果将以前服务停了升级,报错提示: TASK [get PD name] ************************************************************************************************************************************************************************ fatal: [192.168.1.190]: FAILED! => {“changed”: false, “content”: “”, “msg”: “Status code was -1 and not [200]: Request failed: <urlopen error [Errno 111] Connection refused>”, “redirected”: false, “status”: -1, “url”: “http://192.168.1.190:2379/pd/api/v1/members”} 遇到这个问题后,我就将服务起来,然后在重新执行
ansible-playbook excessive_rolling_update.yml

启动服务后升级,报错提示: TASK [wait until the PD port is down] ***************************************************************************************************************************************************** fatal: [192.168.1.190]: FAILED! => {“changed”: false, “elapsed”: 300, “msg”: “the PD port 2379 is not down”}

能否提供思路解决一下这个问题。

TASK [stop PD by systemd] ***************************************************************************************************************************************************************** ok: [192.168.1.190]

已解决,以为V2.1.1中配置了开启了binlog和配置pump和kafka相关的,我在升级3.0.1时想等升级完成后在开启,后来的报错也是因为这块引起的。我关闭binlog和pump后,重新tidb,然后在执行ansible-playbook excessive_rolling_update.yml 通过。