11亿表的数据删除数据越删越慢

h5n1 · 2023 年8 月 16 日 03:30

看下你那个tikv-detail 下GC几个监控面板时间长点

zhanggame1 · 2023 年8 月 16 日 03:32

compact 释放空间那是针对drop和truncate操作，detele后compact 不释放空间，只是插入新数据能复用原来的region了

zhanggame1 · 2023 年8 月 16 日 03:33

对于delete来说，这个操作基本没意义

zhanggame1 · 2023 年8 月 16 日 03:34

插入要不用batch，要不就拆分sql一次一部分数据，insert into…select 非常吃内存，很容易oom

h5n1 · 2023 年8 月 16 日 03:38

人家是delete 你让人insert。

学习下 GC 和 gc in compaction filter ，另外从哪里看的复用原来的region 这个说法

https://docs.pingcap.com/zh/tidb/stable/garbage-collection-overview

https://docs.pingcap.com/zh/tidb/stable/garbage-collection-configuration#gc-in-compaction-filter-机制

zzw6776 · 2023 年8 月 16 日 03:48

screencapture-192-168-10-148-3000-d-RDVQiEzZz-tidb-online-tikv-details-2023-08-16-11_47_121920×15051 1.71 MB

h5n1 · 2023 年8 月 16 日 04:01

看这个截图你的gc是正常进行的，以下几个建议前面也说过
1、 tidb 有非事务DML 根据指定的列和行数分批次DML，串行，这个和前面执行delelete sql是不一样的，没有大量的mvcc版本读取，性能比较稳定，你的版本是6.5.1可以用这个。
2. gc in compaction filter后，mvcc版本的数据gc是随着compact进行的，过来safepoint interval后看不到马上有GC
3. region合并时有阈值条件的， max-merge-region-keys max-merge-region-size 达到这个值后相邻的region才会合并，向右合并，不相邻的合并不了，哪怕没数据，另外如果有tiflash ，也会影响合并。delete后虽然有用数据低于这个值，但是还有mvcc的数据在里面也要算上的
4. lsm tree 收缩空间就靠compact，compact会清理rocksdb 内标记tombstone的数据（GC后的），有些数据在最底层光上层的compact 是清理不掉的，允许的话还是做手动compact(可以看下面测试):
tikv-ctl --host 10.172.65.156:20161 compact -c write -d kv --bottommost force 还有default cf