【概述】:监控报警GC无法正常工作:TiKV_GC_can_not_work
【背景】:0、问题期间数据库侧无任何操作;
1、根据官网解决方法,见附件一图,找出GC leader,通过grep gc_worker tidb.log 查看GC情况,发现是在做start delete ranges,见附件二图,符合官网的说法,但是报警仍然不断。
2、查看集群GC参数,详见附件三图,发现gc_safe_point许久未更新,但查看infomation_schema.cluster_processlist,未发现长时间未完成的SQL。
【现象】:长时间无gc,可能导致垃圾数据增多,影响集群整体性能
【问题】:持续报警近一周,无法解决
【业务影响】:目前暂无业务影响
【TiDB 版本】:v4.0.8
【附件】: