dm 迁移速度很慢如何排查

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】:4.0
  • 【问题描述】:DM v2.0.0-rc.2
    迁移单表 6000 万数据,需要将近11h迁移完成,可以从哪些方面排查?

若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

辛苦上传下下游 tidb grafana 监控中 overview 面板看下,
task 文件的配置和 dm 监控面板看下.
dm 导入数据, 基础就是数据写入问题, 可以从写入慢等问题上入手, 需要关注以下几点,

  1. dm thread count 设置
  2. tidb 是否出现热点问题
  3. tidb 磁盘 io 等

感谢回复

tidb dm 监控 及 task 配置见附件
tidb dm 监控截图.docx (1.5 MB)

看起来 tidb 磁盘压力较大, 而且 tikv 单点压力较大, 热点问题应该比较严重,按照下面文档可以排查下:
https://docs.pingcap.com/zh/tidb/dev/troubleshoot-hot-spot-issues

可以将 loader worker 调低些, 看下 duration 是否能降下来点.

感谢回复。
我这张表是自增主键 6000多万数据,确实存在热点问题。
自增主键存在业务含义,无法使用 AUTO_RANDOM ,还有别的办法提升这个迁移速度嘛?

首先不建议自增主键与业务相关, 建议改造下表结构.

为了解决自增主键热点问题才有这些解决办法, 如果没办法改造表结构可能没有好的办法, split region 也是会有自增主键连续插入引起的热点问题

好的 感谢

:+1::+1::+1::+1: