为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。
- 【TiDB 版本】:v4.0.7
- 【问题描述】:
我看TiDB的某文档介绍,说使用TiSpark写入TiKV,400万行用了5分钟。我们是打算用TiSpark做实时数仓的。如果每次分析完,光写入数据就用5分钟的话,时效性就太差了。
1、正常用Spark写Hive的话,400万行数据,几秒就能写完了。请问TiKV可实现这种高速的写入吗?Spark往HDFS写数据,可能是通过写文件的方式写入的,所以速度挺快的。
2、我们用的是机械硬盘,所以在进行分析的时候,磁盘的读写是瓶颈,我们目前是想通过TiSpark+TiKV解决这个问题。请问相比于使用TiSpark从HDFS中读取数据,TiSpark从Tikv中读取数据是不是会快很多?同时相比于使用TiSpark向HDFS中写数据,TiSpark从Tikv中读取数据是不是会慢很多?