TiDB 安装Pump重启后,DM任务失败且无法resume

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】:V3.0.5
  • 【问题描述】:TiDB 安装Pump重启后,DM任务失败且无法resume

我在安装完Pump后,使用ansible-playbook rolling_update.yml --tags=tidb 命令更新重启tidb server, 重启成功后,发现DM增量同步任务失败了,进行resume操作无效。

看错误是连接不可用,把query-status结果贴一下

1.提供下 DM 版本 2.使用 query-status task任务名 查看下具体信息 看报错日志中出现 bad connection ,重启 tidb-server 时,DM 连接下游 tidb-server 失败,建议重启下 task 任务试下

DM版本是v1.0.3, 重启了task现在又正常了,query-status显示是running状态。 另外,Pump安装启动成功后,我启动drainer_mysql失败了,报错是wait until the drainer port is up。配置文件就只是修改了drainer_mysql_drainer.toml中的[syncer.to]部分,其他使用的是默认值。

drainer_mysql_drainer.toml文件中需要配置上游TiDB和下游mysql的对应的库名吗? replicate-do-db这项配置需要填写的是TiDB的数据库还是下游mysql的数据库,上下游的库名可以不一致吧?

关于 DM 的版本,目前最新版本是 1.0.2,1.0.3 预计会在十二月初发布哈,使用 DM 测试的话,建议使用稳定版本。

2.drainer 没有启动成功,可以看下日志或者是否有端口冲突的情况,或者手动到 drainer 机器上手动启动。

3.drainer 的配置文件可以参考官网,replicate-do-db 配置上游数据库,暂时没有库名转化功能。

https://pingcap.com/docs-cn/stable/reference/tidb-binlog/deploy/#第-3-步部署-drainer

1、刚确认了以下,我是用的DM版本是1.0.2,我记错了。
2、查了以下drainer的启动日志,发现是权限问题,drainer会在指定的数据库上新建一个tidb_binlog库,但是没有权限,目前我使用的是公司RDS测试数据库,的确是没有建库权限。我看到官方文档Drainer 配置文件里面有
syncer.to.checkpoint这个选项,但是我使用的TiDB V3.0.5里面配置文件没有syncer.to.checkpoint选项,现在是新版本中这个强制开启了吗,可以先关掉做下测试吗?


V3.0.5 drainer.toml配置文件:drainer.toml (2.5 KB)

可以添加 syncer.to.checkpoint 后测试一下。案例配置文件中基本上是涉及了其中的所有功能,可以根据自己的需求自行添加或者删除配置。

好的,谢谢:+1:

:+1::+1:

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。