tispark查询数据量和直接tidb查询数据量不一致

对不上。

| class_code  |
| G01D13/22%H02K21/14 |
| H02K%B60K%G01D13 |
| G01H/4%B70K |

我的数据是这样用%分割的多个class_code,我想要把里面所有%拆分后的H开头的全部取出来,即第1条和第二条。 这里用tidb直接执行 where class_code like ‘H%’ or class_code like ‘%\%H%’ 查询可以,用tispark只能查出来第二条。虽然可以执行spark函数进行分割后过滤,但是我们其他同事并不熟悉spark函数,因此普适性不强。