TiDB 的问答社区

查询cluster_config时间过长，服务不可用

🪐 TiDB 技术问题

TiDBer_99x37Qii (Ti D Ber 99x37 Qii) 2025 年1 月 30 日 02:24 1

【 TiDB 使用环境】生产环境
【 TiDB 版本】8.1.1
【复现路径】突发性（暂时还清楚什么原因会复现）
【遇到的问题：问题现象及影响】
在早上8:00左右服务宕机，tidb一台服务（243）不可用
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面

【复制黏贴 ERROR 报错的日志】

【其他附件：截图/日志/监控】

小龙虾爱大龙虾 (Minghao Ren) 2025 年1 月 30 日 02:52 2

看图 243 节点有内存升高，然后其他节点报不可达，慢查询又显示有很多 analyze 任务占用很多内存，所以有可能是 analyze 的问题

1 个赞

有猫万事足 2025 年1 月 30 日 10:14 3

8点的时候应该是执行了一个alert table导致这个243 oom了，不过没想通的是为啥1个半小时才起来？
像是243上还有个tikv，tidb已经oom的情况下，还在疯狂扫描alter table的数据，导致tidb一直等到扫描完成才起来，这样才能解释的通。

tikv的监控信息，集群拓扑也提供一下，感觉还是混合部署的问题。

Kongdom (Kongdom) 2025 年1 月 30 日 13:47 4

看上去analyze占用了很多内存，是否就可以将analyze改为夜间执行，白天不执行？

TiDBer_LwfCbcGm (Ti D Ber Lwf Cbc Gm) 2025 年2 月 9 日 12:38 5

这内容占比太高了，后台多少任务呢？

优化一下。

templey (templey) 2025 年2 月 10 日 01:52 6

从图中信息看的话,感觉在7点55到8点有altertable操作,导致io超高,把服务拉挂了,所以检查下这个时间的alter和analyze

©2023 TiDB Community. 京ICP备20022552号-5 京公网安备11010802043344号