tikv gc

【 TiDB 使用环境】线上、测试、调研
【 TiDB 版本】
【遇到的问题】
每天有20万条写+20万条更新, 1T的数据量。 查询QPS在2000, 如果将kv的gc设置成24小时和30天,分别额外需要多少存储呢?写按照一条1k来算。
【复现路径】做过哪些操作出现的问题
【问题现象及影响】

【附件】

请提供各个组件的 version 信息,如 cdc/tikv,可通过执行 cdc version/tikv-server --version 获取。

可以自建个环境试试,物理存储大小和逻辑存储大小 肯定是有差异的

那大概估算一下呢?

不gc的话,更新就当成插入计算。
数据量没法估算,底层是rocksdb,数据会压缩的。
再说,gc不建议改成30天,假设每天一个kv更新1次,30天有30个版本。每次扫数据的时候费老劲了,看一个kv不是,再看一个kv又不是。多慢啊。