为何auto analyze table总是失败，而人工执行analyze table却能成功呢？

DBRE · 2023 年11 月 24 日 03:48

【 TiDB 使用环境】生产环境
【 TiDB 版本】5.2.2

【遇到的问题：问题现象及影响】
为何auto analyze table总是失败，而人工执行analyze table却能成功呢？两者做analyze有什么不同吗？这套集群遇到很多次了

tidb.log关于analyze的日志：

h5n1 · 2023 年11 月 24 日 04:12

自动analyze是单线程，大表因为gc问题导致失败。手工执行时多线程的有几个build相关变量可以控制并发度

DBRE · 2023 年11 月 24 日 05:09

但是手工analyze也需要接近2个小时，远超tidb_gc_life_time设置了，这是为啥呢？

xingzhenxiang · 2023 年11 月 24 日 06:11

并发度不一样啊

h5n1 · 2023 年11 月 24 日 06:13

从你发的日志可以确定auto analyze是因为超过GC失败，是因为以前的版本后台任务运行时没有考虑自动增加gc safepoint时长，6.x版本后才改进,减少因GC失败。前台任务对于长时间执行的是可以增加safepoint时长的，自动调整，你可以试试在手动analyze 超过gc saepoint后，查看以下saepoint时间：pd-ctl service-gc-safepoint

heiwandou · 2023 年11 月 24 日 06:16

自动分析比较慢呀

forever · 2023 年11 月 24 日 11:53

不是慢不慢的问题，自动的都是20分钟就报错了

DBRE · 2023 年11 月 25 日 01:47

{
“service_gc_safe_points”: [
{
“service_id”: “gc_worker”,
“expired_at”: 9223372036854775807,
“safe_point”: 445874237452845193
}
],
“gc_safe_point”: 445874237452845193
}

请问这个如何转换为时间呢？

forever · 2023 年11 月 25 日 01:54

select TIDB_PARSE_TSO(9223372036854775807);
或者
tiup ctl:v<CLUSTER_VERSION> pd -u https://127.0.0.1:2379 tso {TIMESTAMP}

DBRE · 2023 年11 月 25 日 02:00

那看来show global status like ‘tidb_gc_safe_point’;这个应该也可以

dba远航 · 2023 年11 月 26 日 00:52

应该是受参数影响造成的

system · 2024 年1 月 25 日 00:53

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。