分区的表的analyze非常慢，能不能优化下

zhanggame1 · 2024 年1 月 22 日 09:40

如果用了分区表，tidb会把每个分区作为一个独立的表进行analyze。问题是每个分区的analyze特别慢如图

上面的例子共有5个步骤：
auto analyze table all columns with 256 buckets, 500 topn, 1 samplerate
merge global stats for z_qianyi.win_ticket’s index ind_win_time
merge global stats for z_qianyi.win_ticket’s index ind_paid_time
merge global stats for z_qianyi.win_ticket’s index primary
merge global stats for z_qianyi.win_ticket columns

最后这个非常非常慢，这个分区也就4万条数据。看看能不能优化下

tidb菜鸟一只 · 2024 年1 月 23 日 00:42

讲实话，tidb对分区表支持的不是特别好，你试一下针对单个分区进行analyze看一下慢不慢

zhanggame1 · 2024 年1 月 23 日 01:55

非常非常慢，和自动分析一样，分区多了这么分析还不如直接analyze 全表

比如手工测试ANALYZE table z_qianyi.win_ticket PARTITION P359025;
执行了760秒

这个分区总共16万条数据，全表扫描也就几秒的事。
win_ticket表共690个分区

heiwandou · 2024 年1 月 23 日 02:29

开始始间和结束时间截图分享下

zhanggame1 · 2024 年1 月 23 日 02:49

也有失败的

随便改个用户名 · 2024 年1 月 23 日 03:03

我们实际使用也这样，感觉ANALYZE 比较慢

xingzhenxiang · 2024 年1 月 23 日 03:07

可以调整并发参数试试，这样能加快

WinterLiu · 2024 年1 月 23 日 03:36

有个疑问，tidb已经是分布式的了，还有必要做分区表吗？

zhanggame1 · 2024 年1 月 23 日 03:46

tidb分区表就一个地方用，删除大量数据

zhanggame1 · 2024 年1 月 23 日 04:14

分区表参数tidb_auto_analyze_partition_batch_size我试试1调整到100

路在何chu · 2024 年1 月 23 日 05:57

分区表删数据方便，为了这个功能

zhang_2023 · 2024 年1 月 23 日 07:18

我这边也很慢，不知道怎么回事

zhanggame1 · 2024 年1 月 23 日 09:17

刚才测试了tidb_auto_analyze_partition_batch_size改大应该有明显效果，我直接1改成100了。

根据分析，分区表的分区analyze，对分区做统计是很快的，比如我们数据量小，几秒就完事了，慢在merge global stats for test_vegas2.ticket columns 这步骤上了，多个分区可以公用这个步骤，所以改大效果很好，前提是分区数据量小

有猫万事足 · 2024 年1 月 23 日 15:27

https://github.com/pingcap/tidb/issues/47275
这块在7.4版本后开启了一系列优化。

https://github.com/pingcap/tidb/issues/50030
merge global stats 7.6可以异步执行。
以前是要把所有分区统计完才能合并，现在可以边统计边合并。

zhanggame1 · 2024 年1 月 23 日 23:41

merge global stats 这个步骤执行慢不说，一般都是结果fail

The-Fallen-Angel · 2024 年1 月 24 日 00:22

tidb对分区支持性不是很好

哈喽沃德 · 2024 年1 月 24 日 01:25

单个分区弄吧，如果还是慢那就没招了。

zhanggame1 · 2024 年1 月 24 日 02:05

tidb_merge_partition_stats_concurrency我看有这个参数，可以增加merge并行度

zhanggame1 · 2024 年1 月 24 日 13:45

现在还有个问题就是merge那一步总是报错

zhanggame1 · 2024 年1 月 26 日 06:12

最后说下研究的结果：

慢的原因是7.5.0版本等有BUG，在merge global stats那一步不但慢，大概率还会failed报错"illegal bucket order"
该报错在7.6.0更新说明所提示修复： * 修复并发合并分区表的全局统计信息时可能遇到报错的问题 #48713 @hawkingrei

经过部署7.6.0版本测试，7.6.0版本merge global stats不会报错，而且速度快了十几倍