tispark写Tikv

Tongzhenguo · 2020 年8 月 31 日 09:43

为提高效率，提问时请提供以下信息，问题描述清晰可优先响应。

2.是否有dataframe写tikv的代码demo，难道就如下一行就可以？还是怎么写？

spark.sql("insert into table tidb_tb select * from df_tb");

3.看了下tispark 1.2.1只支持jdbc的方式写入，和rdd.forEachPartition区别不大？那follow-up是从tispark哪个版本才开始支持tispark直接写tikv？

birdstorm · 2020 年8 月 31 日 11:13

从 TiSpark v2.3 开始，TiSpark 才开始支持直接写入 TiKV

如果希望使用直接写入的特性，并且使用的是旧版本的 TiSpark，需要更新至至少 TiSpark v2.3，所需要的 TiDB 集群版本为 v3.0.14 及以上，支持的 Spark 版本为 Spark v2.3/v2.4 。

Tongzhenguo · 2020 年8 月 31 日 11:19

spark不好动，还要保持2.1.1:rofl:

birdstorm · 2020 年8 月 31 日 11:24

目前 2.1.1 的 Spark 版本没办法支持直接写入，因为 TiSpark 直接写入的功能依赖了 DataSourceAPI v2 这个只有 Spark v2.3 之后才支持的 API。如果要保持 2.1 的 Spark，可以暂时使用 jdbc 的方式。

Tongzhenguo · 2020 年8 月 31 日 11:33

那spark 3.0呢？

birdstorm · 2020 年8 月 31 日 11:35

Spark 3.0 正在支持中。可以关注相关的 issue：