insert批量插入数据慢

TiDBer_KLYr54xi · 2025 年9 月 18 日 02:17

感谢各位大佬，目前我采用了多个小文件(200M以内)进行批量并发导入，速度提上来了，测了一下之前单个一个G要花40多分钟，现在10分钟内就导完了

TiDBer_CYsnk4cG · 2025 年9 月 18 日 02:25

数据量巨大的情况下调整region-concurrency不知是否有性能提升？

TiDBer_KLYr54xi · 2025 年9 月 18 日 08:03

有提升但是不明显，我的是16核的，数值调成12，16，32速度变化不大，感觉核心应该还是单个sql文件大小超过256M之后，导入速度上不去

TiDBer_KLYr54xi · 2025 年9 月 18 日 08:07

不过目前还有个问题，就是tidb-lightning导入的时候，有个pd挂了导致同步任务中断了（我配置了断点续传），重启pd之后，继续传的时候报错了让我用tidb-lightning-ctl工具检测，但是也没搜到这个工具，我用tiup install tidb-lightning-ctl 也没装上 jiu 比较尴尬了，原表数据也不能清理

cchouqiang · 2025 年9 月 22 日 07:29

tidb-lightning-ctl 这个工具在toolkit包里

麻辣机师 · 2025 年9 月 23 日 01:15

在慢查询里面能否看到慢的INSERT？如果能看到，那可以看下慢查询记录中的PLAN，如果不能看到到，那问题应该不在INSERT本身

ziri0623 · 2025 年9 月 24 日 01:42

默认的大小，优化文件大小吗

TiDBer_xx13 · 2025 年9 月 25 日 00:39

看看执行计划

sherq1989 · 2025 年9 月 28 日 02:11

跟文件大小也有关系吗可以测试下

Sakura6680 · 2025 年9 月 29 日 03:46

应该是文件数量过多了，不是文件大小的问题

BraveChen · 2025 年9 月 29 日 09:43

导入的话，读文件也耗时。不是配置的问题，仅调整tidb-lightning 配置，要么使用物理导入，逻辑导入的话，对照官方文档调整导入并发即可

Sakura6680 · 2025 年9 月 30 日 16:09

可以试试并行操作

北极星DB · 2025 年10 月 14 日 09:37

单个文件并启动了并行？如果这样可能性能会受到影响，单个开启并行可能反而影响效率吧，类似单个cpu切换时间片的方式，失去了真正的多线程/多进程的优势~

北极星DB · 2025 年10 月 14 日 09:37

有道理~

北极星DB · 2025 年10 月 14 日 09:39

嗯，可能真跟这个有关系，单个文件快过大，导致内部扫描或检索太慢

TiDBer_KLYr54xi · 2025 年10 月 15 日 00:52

目前导入速度基本稳定再15分钟左右了，写了两个tidb-lightning任务一起导，region-concurrency = 15；单个sql文件保持在200M左右，速度比较稳定

北极星DB · 2025 年10 月 16 日 06:14

恭喜，还是有效果的哈~

gaozu · 2025 年10 月 16 日 18:53

优化一下…

ziri0623 · 2025 年10 月 16 日 23:51

看文件大小，优化一下