Tiflash一些问题

1.TiFlash 使用 Raft 协议来实现数据同步,通过读取 Raft 日志的 idx 值来进行同步,这个有具体的文档出处吗?
2. DeltaTree index是TiFlash 的索引吗?,列存为啥一般就不需要索引呢?

文档可以百度,列存不需要索引的原因是查询列存的目的是按列统计分析,而且是大量数据的查询,这个时候往往不需要索引过滤

没有文档的,有源码,可以直接看…

官方有些blog 你可以参考下


列存和行存最大的区别是采用了不用的取数模型,行存是火山模型,列存则是 向量引擎

随便画了画,帮助理解


行表读取数据,如果一般通过rowid直接确定对应行的数据数据,然后根据需要返回对应列,如果是通过索引,就是先通过索引字段来确定行的rowid,然后回表确定对应行的数据数据,然后根据需要返回对应列(如果只需要索引列的数据就无需回表)
列表读取数据,一般是针对某列或者某几列汇总,直接会查询对应列的汇总数据,如果查单个值,会根据rowkey来获取对应列的对应值数据。
你其实可以把列存当成一个每个字段都有索引的多索引拼成的一个行表。。。所以列存每个字段都相当于索引,也就不需要在单独创建索引了。

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。