非事务DML功能增加并发执行能力

建议非事务DML功能增加并发控制能力,比如加个parallel xx 选项能够控制并发执行分组SQL的并发度以加快执行速度,现在是分组后串行执行,如果再手工拆范围的话也比较麻烦,体现不出这个特性优势。

另外非事务DML执行时的执行计划有什么特殊地方?之前导入一张表 然后insert into select到另一张表,使用user_id二级索引每10000条一组,实际执行过程中发现分组的SQL执行时用的全表扫描。而这些sql单独拿出来执行explain\explain analyze都可以使用索引,收集统计信息后,非事务DML能正常使用索引。

1 个赞

https://docs.pingcap.com/zh/tidb/v7.4/sql-statement-import-into#import-into,

import into语法后期可能会支持import into xxx select xxx,借助lightning local模式大幅加快处理速度。

import into语法只是处理数据文件吧

是的,现在还不支持 :joy:

文档里 没 import into xxx select xxx 语法

是的,现在还不支持 :joy_cat:

建议不错,但是分布式数据库在对DML并发的控制方面难度是大于普通单一数据库的

SQL里加并发度很有用,在系统割接上线需要割接或处理数据时

我觉得tidb的性能不在于写而是在于读,没必要学的跟oracle一样

不是学谁的问题,是为了解决一些实用的场景,比如我们现在用的很多的,从一个表里取一部分数据到备份表,然后加工数据