为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:
【 TiDB 使用环境】
【概述】 场景 + 问题概述
在一个过亿的数据表中, 需要根据当前表的数据,经过一定的业务操作修改数据,再把数据回填到当前表中,简单的说就是根据当前数据修改数据。
目前计划是通过tispark,但因为spark 目前好像还不支持update操作,操作方式是append;
故在spark使用了insert int xxx() ON DUPLICATE KEY UPDATE 的方式;不过目前测试下来,性能不佳,请问各位大佬,有什么良策呢?
【背景】 做过哪些操作
【现象】 业务和数据库现象
【问题】 当前遇到的问题
【业务影响】
【 TiDB 版本】
tidb-v5.1.1
【附件】 相关日志及监控(https://metricstool.pingcap.com/)
若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。