PCTA-TiDB4.0-3.6.1 TiDB 数据迁移工具介绍-2班@王燕辉

课程名称:课程版本(101/201/301)+ 课程名称

学习时长:1H

课程内容:

  • Dumpling
    • 什么是Dumpling
      • 将TiDB/MySQL中的数据以SQL或CSV格式导出,用于逻辑全量备份或导出
      • 用Go编写,pingcap/dumpling
    • 较之Mydumper,Mydumpling改进
      • SQL格式或CSV格式
      • table-filter
      • 为TiDB优化
        • 配置单条SQL内存限制
        • 对>=4.0版本,支持自动调整GC时间
        • 使用隐藏列 _tidb_rowid优化单表并发导出的性能
        • 可设置tidb_snapshot的值来指定数据备份时间点,保证备份一致性,而不是使用flush tables with read lock
  • Lightning
    • 什么是Lightning
      • 一个用于快速全量导入海量数据到TiDB集群的工具
    • 支持读取通过Mydumper导出的SQL或CSV
    • 使用场景
      • 快速导入海量新数据
      • 全量备份恢复
    • 架构
  • Data Migration(DM2.0)
    • 什么是DM
      • 一体化的数据迁移管理平台
      • 支持全量或增量数据从MySQL/MariaDB迁移到TiDB
      • 减少运维成本简化错误处理流程
    • 功能
      • 支持table routing
        • 将上游MySQL或MariaDB特定表复制到下游特定表
      • 黑白名单过滤
      • binlog事件过滤(更西粒度)
      • 在线DDL
      • 分库分表的合并迁移
        • 将上游MySQL/Mariadb相同或不同的表数据合并迁移到下游同一个表
    • 架构
      • DM-master负责管理和调度数据迁移任务和各项操作,保存监控集群的拓扑信息,监控DM-worker的运行状态,提供数据迁移的统一入口

      • DM-worker负责执行数据迁移具体任务

      • dmctl命令行工具用于创建、更新或删除数据迁移任务