TiDB 的问答社区

用pytispark写入从tidb的一个表写到另一个表性能很差

🛸 其他技术问题 TiSpark

shiyuhang0 2023 年10 月 19 日 05:32 4

写时候的读取是用于冲突等判断
根据之前的 bechmark, 4000w 的数据用 tispark / spark jdbc 应该都是分钟级别的。如果不需要全局事务还是建议 spark jdbc
你现在的并发度是多少，benchmark 里的是 32。如果低了可以增加 executor 数量/核心数来增加并发

©2023 TiDB Community. 京ICP备20022552号-5 京公网安备11010802043344号