记录故障处理:v7.1.0 版本gc不能正常推进

【TiDB 使用环境】生产环境 /测试/ Poc
【TiDB 版本】7.1.0
【操作系统】centos7
【部署方式】机器部署
【问题复现路径】
1、查看集群GC发现自从6月23日就没gc告警。

2、对比后发现有个cdc任务是20250623-15:57:54.245时间戳 stop的。

3、remove掉cdc任务,GC还是不正常推进。

4、查看service-gc-safepoint

{
  "service_gc_safe_points": [
    {
      "service_id": "gc_worker",
      "expired_at": 9223372036854775807,
      "safe_point": 459288745108045824
    },
    {
      "service_id": "ticdc-default-6745880471065248223",
      "expired_at": 1752128911,
      "safe_point": 458926450080481284
    }
  ],
  "gc_safe_point": 458926450080481284
}

» tso 458926450080481284
system:  2025-06-23 15:57:54.245 +0800 CST
logic:   4

5、缩容掉所有cdc,GC还是不推进

6、手动清理service_gc_safe_points

curl http://10.1.1.41:2379/pd/api/v1/gc/safepoint
curl -X DELETE http://10.1.1.41:2379/pd/api/v1/gc/safepoint/ticdc-default-6745880471065248223

7、查看safepoint

8、gc已恢复

1 个赞

:+1:感谢分享

curl -X DELETE http://10.1.1.41:2379/pd/api/v1/gc/safepoint/ticdc-default-6745880471065248223

还真是这么删的。最近ai生成的不靠谱的多。大致求证了一下,这个应该是没问题的。

另外可以写个文章记录一下这个处理过程,也很好。而且积分更多。

1 个赞

恩了,谢谢大佬求证。
有时间记录一下,分享给大家。

1 个赞

:muscle:严谨的源码大佬~

1 个赞

此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。