合并之后的大 ColumnFileTiny 要替换原来小的呀。合并大文件主要是为了减少 IO 次数。当然如果合并的过程中排序,对数据的局部性也有帮助,但是似乎帮助不是非常大。我很久以前 hack 过一个有 bug 的版本,发现没有明显受益,bug 一时半会儿也难查,就放弃了 Orz。
合并之后的大 ColumnFileTiny 要替换原来小的呀。合并大文件主要是为了减少 IO 次数。当然如果合并的过程中排序,对数据的局部性也有帮助,但是似乎帮助不是非常大。我很久以前 hack 过一个有 bug 的版本,发现没有明显受益,bug 一时半会儿也难查,就放弃了 Orz。