根据你的描述,涉及到的数仓还是偏实时的或者说准实时的,那就姑且认为需求为准实时数仓,先说一下我们当初选择TiDB+TiSpark的理由,因为已经有一套SqlServer在出数了,而且跑了很复杂的存储过程,如果贸然改变计算逻辑是不太现实的,而支持即时更新的也只有TiDB做的到,因此选择了TiDB+TiSpark,当然本身基于spark的查询也基本能够保证性能要求。在说回这三种选型把,impala+kudu最常见的就是神策了,对于实时性要求能够满足分钟级别要求,在千万亿级别这种场景下,分析的性能应该是最好的。hbase+phoenix本身你有说了,因为hbase的特性来说,单点是能够快速查询的,基于开源版本的phoenix在千万级别的数据就有可能会出现性能瓶颈,阿里云的就另说了。基于hbase的apache社区还有一个Trafodion,你也可以测测。最后说一下,TiDB+TiSpark,目前的olap还是基于spark的,存粹从性能角度说,在大数据量的情况下,大部分join的性能应该是差别不大,或者说比不上impala的。想要看性能还是等等TiFlash把。如果是应用场景那就自己去选择了。
3 个赞