dumpling导出的备份文件过大

【 TiDB 版本】v5.2.4
dumpling版本:v5.0.3
【复现路径】

备份命令:
/usr/bin/dumpling -h 10.220.62.24 -P 4000 -u zzzz -p xxxxx -t 16 -F 256MB -o /data/tidb_bak/tidb_10.220.62.24/ -L /data/tidb_bak/dumpling_10.220.62.24_2023013116.log -r 100000

【遇到的问题:问题现象及影响】
另一个正常集群(同版本)备份情况正常,tikv使用空间大小约10T,备份出来差不多5T

问题的备份目标集群的tikv使用空间大小总的加起来也不到2T,但是备份出来的文件能达到8T+(压缩前),只是这个集群近期有较多数据写入,备份占用较大的几个表不含大字段

题外话,个人建议,一个集群最好还是用统一的版本,如果不统一,也建议工具版本大于TiDB本身的版本。

不同版本可能压缩比不一样吧。dumpling是逻辑备份,导出的是sql语句,体现的数据量是比较准确的。

好的,谢谢,官方这里找不到统一版本了,我把工具替换成最新版本,明天看看效果

使用的另一个集群(同版本)备份情况正常,tikv使用空间大小约10T,备份出来差不多5T
(这些信息更新到问题里了)

感觉似乎不是压缩比的关系,我先替换下版本看看

tikv使用空间是不是3副本的数据?备份的话应该是单副本

可以按表备份,完成一个清理一个。

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。