tidb_gc_enable 关了半年之后，重新开启异常

TiDBer_yangxi · 2024 年5 月 6 日 10:59

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】
【复现路径】做过哪些操作出现的问题
【遇到的问题：问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件：截图/日志/监控】
tidb_gc_enable 关了半年。。。
mysql> show status like ‘%gc%’;
±----------------------±----------------------------------------------------------------------------------------------------------+
| Variable_name | Value |
±----------------------±----------------------------------------------------------------------------------------------------------+
| tidb_gc_last_run_time | 20231026-15:06:47.521 +0800 |
| tidb_gc_leader_desc | host:sjpt-dbdc-tidb9.dc.wxxdc, pid:37499, start at 2023-11-16 18:59:16.797709803 +0800 CST m=+1.565898972 |
| tidb_gc_leader_lease | 20240506-17:23:16.802 +0800 |
| tidb_gc_leader_uuid | 62f5f240ab00003 |
| tidb_gc_safe_point | 20231026-14:56:47.521 +0800 |
±----------------------±----------------------------------------------------------------------------------------------------------+
5 rows in set (0.20 sec)

tidb@sjpt-dbdc-tidb7:~$ tiup ctl:v7.1.1 pd service-gc-safepoint
Starting component ctl: /home/tidb/.tiup/components/ctl/v7.1.1/ctl pd service-gc-safepoint
{
“service_gc_safe_points”: [
{
“service_id”: “gc_worker”,
“expired_at”: 9223372036854775807,
“safe_point”: 449573624683954176
}
],
“gc_safe_point”: 445200048461185024
}

tiup cdc:v7.1.1 cli --pd=http://10.2.***:2379 unsafe reset 执行无效，重启pd也无效
我看pd日志有：failed to get safe point from pd"] [err_code=KV:Storage:Unknown] [err="Error(Other(“[src/server/gc_worker/gc_worker.rs:80]: failed to get safe point from PD: Other(”[components/pd_client/src/util.rs:427

tidb有日志：
[“[gc worker] delete ranges: got an error while trying to get store list from PD”] [uuid=62f5f240ab00003] [error=“rpc error: code = Unavailable desc = not leader”]

TiDBer_yangxi · 2024 年5 月 7 日 02:34

凌晨一次大的gc之后，safepoint推进了

dba-kit · 2024 年5 月 7 日 05:56

好奇最后清理了多少数据量？可以关掉GC半年，竟然都没出问题。。

TiDBer_yangxi · 2024 年5 月 7 日 06:40

少了四分之一 – 900G

The-Fallen-Angel · 2024 年5 月 8 日 00:14

楼主，说说前因后果。gc关闭半年之久，为了满足什么需求，会有什么影响？比如这么多的垃圾没有回收，对数据、性能都有什么影响？

友利奈绪 · 2024 年5 月 8 日 00:49

没看太懂

呢莫不爱吃鱼 · 2024 年5 月 8 日 02:30

还可以这么玩的吗？

TiDBer_yangxi · 2024 年5 月 8 日 06:52

之前同步数据的时候关闭了，操作完了忘记打开了

kkpeter · 2024 年5 月 8 日 07:25

我也比较好奇，这么久不影响性能吗?

健康的腰间盘 · 2024 年5 月 10 日 01:04

没救了，点几根香，诚心参拜，没准机魂大悦就起来了

TiDBer_rvITcue9 · 2024 年5 月 10 日 01:48

万能重启大法

Qiuchi · 2024 年6 月 14 日 08:45

太牛逼了哥们，所以咋想起来的，是因为越来越慢么

这里介绍不了我 · 2024 年6 月 14 日 09:08

万幸能正常GC

ziptoam · 2024 年6 月 15 日 02:37

这样对自动回收机制的挑战还是蛮大的

zhaokede · 2024 年6 月 15 日 03:27

资源还是蛮多的，半年才重启GC

zhaokede · 2024 年6 月 15 日 03:27

估计一次回收要跑很长时间，如果数据库数据量大且数据变更大的时候

扬仔_tidb · 2024 年6 月 15 日 08:22

另一个角度看tidb强，半年竟然没发现慢

Kongdom · 2024 年6 月 15 日 13:55

不得不说tidb确实稳定，我们有个tikv节点重启之后防火墙忘记关了，结果虽然端口不通，但是正常运行了几个月，最后是因为GC积压太多才发现问题。

system · 2024 年8 月 14 日 13:56

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。