什么场景下开启tiflash比较合适,需要注意什么?

什么场景下开启tiflash比较合适,需要注意什么?

大、宽表

数据量大的表,需要对这个表进行OLAP操作,如对其中一些列进行聚合函数

这个合集帖子可以先看下

1 个赞

ap场景,其实借助clickhouse

你 Tikv 跑不出来的

涉及大量数据的分析型计算任务,尤其是多表关联计算等复杂AP场景

ap计算

olap场景下,比如统计分析场景下,报表展示之类的

这是因为tiflash最早是基于clickhouse开发的,这一点没什么可掩饰的,看tiflash的源码commit记录也还保留了ch的部分。

简单点说,就是sql里面带group by的。如果计算时间特别长。就应该考虑上tiflash。
如果你会看执行计划,那就是执行计划跟节点附近带hashagg,steamagg这类聚合算子的。

是否一定是大表宽表,则没有特别高的要求,不过如果涉及到多表关联+聚合计算的场景,一定记得使用tiflash+mpp。只有mpp模式下,hashjoin可以被下推到tiflash执行。

大宽表,原来在clickhouse上的,都可以弄到tidb上

大表,需要OLAP场景下

有OLAP需求的时候开启比较合适吧,OLTP场景开启的话,感觉有点浪费资源

如果已经使用了TIDB,并且有AP的需求,那么就上TiFlash呗。需要注意资源隔离,别影响隔壁KV老哥了,另外,网络也别打太满,比较网络带宽都是公用的。

其实就是大sql,ap计算,复杂查询

ap请求(即统计分析类的大SQL)

分析类的非业务向的sql

理念很不错,但实际操作起来没有那么方便

数据量大,且涉及排序等对一列的聚合操作会默认启动列查