tispark查询数据量和直接tidb查询数据量不一致

wfxxh · 2024 年3 月 18 日 00:57

对不上。

| class_code  |
| G01D13/22%H02K21/14 |
| H02K%B60K%G01D13 |
| G01H/4%B70K |

我的数据是这样用%分割的多个class_code，我想要把里面所有%拆分后的H开头的全部取出来，即第1条和第二条。这里用tidb直接执行 where class_code like ‘H%’ or class_code like ‘%\%H%’ 查询可以，用tispark只能查出来第二条。虽然可以执行spark函数进行分割后过滤，但是我们其他同事并不熟悉spark函数，因此普适性不强。