TiDB优化器选择问题

mono · 2024 年3 月 6 日 05:38

【 TiDB 使用环境】生产环境
【 TiDB 版本】6.5.7,
【遇到的问题】
最基本的sql。优化器选择的执行计划有问题。导致查询慢。

sql语句：
select * from t1 where create_time >= ‘2024-03-01 00:00:00’ limit 2;

这个表create_time是有索引的。但查询时默认并不走索引。

zhanggame1 · 2024 年3 月 6 日 05:58

手工分析表试试analyze table
另外表数据量多少条，你这个语句实际返回多少条，从estRows 是不是数据条数太少

zhang_2023 · 2024 年3 月 6 日 06:09

收集统计信息

没头脑123 · 2024 年3 月 6 日 06:11

在mysql执行也会出现这种情况，要么统计信息不准确，要么表数据量比较大

buddyyuan · 2024 年3 月 6 日 06:14

你这个表数据量是多少，前面的是它评估在21.5行之内就能找到 >=‘2024-03-01 00:00:00’ 的2条数据。

tidb菜鸟一只 · 2024 年3 月 6 日 06:15

1.收集下统计信息看看
2.表是不是很小，总数据量太小导致完全没必要走索引？

TiDBer_jYQINSnf · 2024 年3 月 6 日 06:16

表的健康度有关吧，我遇到过一开始sql很快，后来突然慢了很多，查了半天是执行计划变了，选择了一个慢的索引，是表健康度太低导致的。

buddyyuan · 2024 年3 月 6 日 06:19

其实很正常，你这个应该是数据有大量倾斜导致的，所以优化器判断全表扫描21行的代价就能找到 >=‘2024-03-01 00:00:00’ 的数据。如果优化器判断我要扫描百万才能找到 >=‘2024-03-01 00:00:00’ 的数据它就会走索引。所以收集一下统计信息，让直方图和topN正确应该就能正常。

Kongdom · 2024 年3 月 6 日 08:03

这个表是不是数据量非常小？如果数据量特别小的话，会直接走全表扫描的。

小龙虾爱大龙虾 · 2024 年3 月 6 日 08:10

翔哥说的对

mono · 2024 年3 月 6 日 09:22

这是个1000多万的表。不走索引要5秒左右。强制走idx_create_time索引，查询耗时是毫秒级的。

redgame · 2024 年3 月 6 日 09:32

新建的表不？

Kongdom · 2024 年3 月 6 日 09:33

那可能就是楼上说的这种情况了

TiDBer_aaO4sU46 · 2024 年3 月 6 日 11:45

按大佬们说的，收个统计信息，再试

residentevil · 2024 年3 月 6 日 11:50

analyze table后，如果确定过滤条件有INDEX【必须是前缀】，先count总条目数，然后在根据过滤条件查出count，如果行数差异>15%，那优化器会认为全表扫描更快

dba远航 · 2024 年3 月 8 日 01:13

你去掉 limit 2; 试试