tidb数据量不大,但存在大量sst文件占用磁盘,怎么才能释放磁盘空间?

好的,感谢

开始用的查询占用语句不太靠谱,可以看看有什么其他方式查,我觉得直接查表的region数量更准确点

学习了

小表按理来说也不会可能占用空间这么大,感觉触发什么bug了

1 个赞

现在也是在排查这个问题,是张实时数据表,很多客户端在不间断的批量update这张表,表不大但update的次数很多,目前看还是没清理历史版本

:joy:第一次见10分钟产生这么大历史版本的

不是10分钟产生这么多历史版本,是一直在产生历史版本,但是一直没回收,时间久了就堆积了很多

那我是不是可以这么理解,错过窗口期之后,GC就不会删除之前的版本,只会删除当前窗口期的版本?

当前窗口期的版本也没删除

如果数据产生速度比gc速度快数据就会越来越多,你看看有没有报错

每一轮 GC 分为三个步骤,这三个步骤在整个 GC 的流程中是串行执行。如果一轮 GC 运行时间太久,上次 GC 还在前两个阶段,下轮 GC 又开始了,下一轮 GC 会忽略,GC Leader 会报 “there’s already a gc job running,skipped”

另外还有一种情况,有没有长事务在用这张表,也会影响gc

这貌似找了个bug呢

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。