如何快速迁移一张表的数据到另一张表

这里介绍不了我 · 2024 年3 月 14 日 03:17

dumpling + lightning 吧

yiduoyunQ · 2024 年3 月 14 日 03:43

dumpling + lightning , 后面会简化为 sql import

ti-tiger · 2024 年3 月 14 日 03:47

数据量不大用INSERT INTO ... SELECT ，数据量大那就要用dumpling导出，lightning导入

buddyyuan · 2024 年3 月 14 日 03:59

你看看 dumpling 导数的时候执行的是什么查询，然后你在把前面换成 insert into + dumpling 类似的sql就行了。简单而言就是先用_tidb_rowid 做个分片。然后开多个并发操作小事务。

tidb狂热爱好者 · 2024 年3 月 14 日 04:57

backup oldtable to s3；
restore newtable from s3；
最快物理文件复制

zhaokede · 2024 年3 月 14 日 04:57

物理导入最快吧

tidb狂热爱好者 · 2024 年3 月 14 日 05:13

都不是物理导入是sst文件复制了一份最快

zhanggame1 · 2024 年3 月 14 日 05:15

感觉还是导出导入最快，当然我选择用工具传输

DBAER · 2024 年3 月 14 日 05:36

基于主键可以并发导入

opkcloud · 2024 年3 月 14 日 06:14

dumpling + lightning

CuteRay · 2024 年3 月 14 日 06:29

看你的 tidb 版本，不同版本处理方式不同，低版本最好的方式就是 dumpling + Lightning，高版本有 batch insert、import into select等

Soysauce520 · 2024 年3 月 14 日 06:31

insert select 也可以，select 先查下_tidb_row_id，然后根据rowid分批提交。速度也还可以，比较省事。不能一次太大量，会很慢。batch可以省事些。看追求速度不，很多方式。大表肯定是导入再物理导入最快的。

Hacker_6ASfgBFe · 2024 年3 月 14 日 06:44

lightning 导入的时候，怎么指定导入哪个库的哪张表，导出的时候，没有指定导出表结构，库里已经有表结构了

像风一样的男子 · 2024 年3 月 14 日 07:09

dumpling导出的文件是以库名.表名来命名的，你把库名表名改成你要的就可以了。

Hacker_6ASfgBFe · 2024 年3 月 14 日 07:11

是改导出的文件名和文件内容？，不能在lightning里面指定吗

像风一样的男子 · 2024 年3 月 14 日 07:12

改名是最方便的，导出的是csv文件改文件名就行，按照文件名匹配的

Hacker_6ASfgBFe · 2024 年3 月 15 日 00:51

lightning导入会增加磁盘io压力，达到100%，线上还是选择insert…select会好点

TiDBer_rvITcue9 · 2024 年3 月 15 日 01:08

insert。。select

vincentLi · 2024 年3 月 15 日 01:41

oacle的最佳实践应该是通过data pump来导出导入。insert into为什么不是最快的呢？因为对于大表会产生很大的undo，因此生产一般不用。
对应的tidb，应该是用import into的方式比较安稳。

shuyu_zhihui · 2024 年3 月 19 日 06:09

为什么要做分区呐？有什么明显的优势嘛

如何快速迁移一张表的数据 到 另一张表