tiflash加载的几张表，单张超1.5亿的表，进行数据查询时，执行计划走了tiflash，但是，查询比平时慢2倍以上

有猫万事足 · 2024 年3 月 27 日 02:36

我看他前面的描述，我感觉是他开了mpp，这个执行计划也走了mpp，不过没开动态分区裁剪。
在静态分区裁剪的情况下，分区之间的聚合就到tidb上做了。

vcdog · 2024 年3 月 27 日 02:38

大佬果然厉害，集群目前的配置确实是static静态。

官方文档说，v6.5.0版本后，默认开启动态裁剪模式。为啥我的还是静态，难道是因为是从v5.4.0升级到v6.5.0版本的原因？

tidb菜鸟一只 · 2024 年3 月 27 日 02:39

看你的执行计划，确实应该没有开动态裁剪，你可以查一下SHOW VARIABLES LIKE ‘%tidb_partition_prune_mode%’;
，如果是static，可以SET tidb_partition_prune_mode=‘dynamic’;先修改当前session成dynamic，重新explain anlzye跑一下这个sql，看下执行计划

tidb菜鸟一只 · 2024 年3 月 27 日 02:41

从5.4升级上来的的话，确实默认还会是static，因为5.4的时候默认是static的

有猫万事足 · 2024 年3 月 27 日 02:46

可以session级改成动态试试会不会快一些。

mpp模式下，最理想的执行计划就是task这一栏，上面是几行root，下面全是mpp[tiflash]。

1711507511233

这就意味着tiflash完成了绝大部分的计算，tidb直接拿结果。

vcdog · 2024 年3 月 27 日 02:50

修改为动态裁剪后，再次查看执行计划如下：

有猫万事足 · 2024 年3 月 27 日 02:56

set tidb_allow_mpp=on;
set tidb_enforce_mpp=on;

session级把这两个变量打开，如果还不走mpp，应该可以通过show warnings看到原因。

tidb菜鸟一只 · 2024 年3 月 27 日 02:59

分区表和tiflash是真的很不搭啊，问题多多的，session开启强制mpp再试试
set tidb_enforce_mpp=on;

vcdog · 2024 年3 月 27 日 03:09

好滴，我再打开试下

vcdog · 2024 年3 月 27 日 03:14

开启2个mpp参数后，查看执行计划，还是和原来一样。

vcdog · 2024 年3 月 27 日 03:15

有猫万事足 · 2024 年3 月 27 日 03:17

show warnings

有内容嘛？

https://docs.pingcap.com/zh/tidb/stable/use-tiflash-mpp-mode#控制是否选择-mpp-模式

应该是有warning告诉你为什么不能走mpp的。

有猫万事足 · 2024 年3 月 27 日 03:19

怎么看你这个sql都是一个非常典型的聚合计算，这就应该是列存的优势场景。

vcdog · 2024 年3 月 27 日 03:21

确实是一个聚合，里面有一个Sum的计算。这张表是一个整合其他多张业务表后的宽表。

vcdog · 2024 年3 月 27 日 03:23

有Warning信息

有猫万事足 · 2024 年3 月 27 日 03:26

warning说缺少全局统计信息，所以没有开启动态分区裁剪。

你可能需要对这个大表analyze一下。

vcdog · 2024 年3 月 27 日 03:33

analyze大表，消耗时间较长，我得找个业务低峰时段，进行操作。等执行完后，再次验证，再来回帖。谢谢大佬

mono · 2024 年3 月 27 日 06:56

analyze后，速度嗖嗖的！

Soysauce520 · 2024 年3 月 27 日 06:56

升级到6.5.8，就可以了。手动收集需要注意下要在创建分区之后

vcdog · 2024 年3 月 27 日 07:03

之前，是从v5.4.0直接升级到v6.5.0版本，但是，那个动态裁剪参数，并没有跟着自动设置为默认值。升级6.5.8，也不一定会自动变。目前，这张表已经是分区表，在低峰执行analyze应该没有其他的坑。