什么场景下开启tiflash比较合适,需要注意什么?
大、宽表
数据量大的表,需要对这个表进行OLAP操作,如对其中一些列进行聚合函数
这个合集帖子可以先看下
1 个赞
你 Tikv 跑不出来的
涉及大量数据的分析型计算任务,尤其是多表关联计算等复杂AP场景
ap计算
olap场景下,比如统计分析场景下,报表展示之类的
这是因为tiflash最早是基于clickhouse开发的,这一点没什么可掩饰的,看tiflash的源码commit记录也还保留了ch的部分。
简单点说,就是sql里面带group by的。如果计算时间特别长。就应该考虑上tiflash。
如果你会看执行计划,那就是执行计划跟节点附近带hashagg,steamagg这类聚合算子的。
是否一定是大表宽表,则没有特别高的要求,不过如果涉及到多表关联+聚合计算的场景,一定记得使用tiflash+mpp。只有mpp模式下,hashjoin可以被下推到tiflash执行。
大宽表,原来在clickhouse上的,都可以弄到tidb上
大表,需要OLAP场景下
有OLAP需求的时候开启比较合适吧,OLTP场景开启的话,感觉有点浪费资源
如果已经使用了TIDB,并且有AP的需求,那么就上TiFlash呗。需要注意资源隔离,别影响隔壁KV老哥了,另外,网络也别打太满,比较网络带宽都是公用的。
其实就是大sql,ap计算,复杂查询
ap请求(即统计分析类的大SQL)
分析类的非业务向的sql
理念很不错,但实际操作起来没有那么方便
数据量大,且涉及排序等对一列的聚合操作会默认启动列查