TiDB没有连接数，但是内存和CPU使用超高。如何处理？

CAI001 · 2025 年8 月 18 日 02:02

【TiDB 使用环境】测试

日志没有报错，连接数为1，这个连接内存占用为0，该tidb实例有时候的连接数为0，应该是tiproxy分发策略协调到其他节点了。如何排查这种莫名其妙的高消耗？各位大佬

Kongdom · 2025 年8 月 18 日 02:16

先问一句，是混合部署么？多个组件部署在一台服务器上。

CAI001 · 2025 年8 月 18 日 02:17

这台服务器部署了tidb和pd节点。我看服务器的内存消耗都是tidb-server占用的

Kongdom · 2025 年8 月 18 日 02:19

dashboard里有个top sql的功能可以看是哪些语句用的CPU最高。

CAI001 · 2025 年8 月 18 日 02:26

这个是占用最高的，3小时内共CPU累计耗时1.56min。总体来说没有特别高的

SELECT
  `t`.`id`,
  `t`.`task_key`,
  `t`.`type`,
  `t`.`state`,
  `t`.`step`,
  `t`.`priority`,
  `t`.`concurrency`,
  `t`.`create_time`,
  `t`.`target_scope`,
  max (`st`.`concurrency`)
FROM
  `mysql`.`tidb_global_task` `t`
  JOIN `mysql`.`tidb_background_subtask` `st` ON `t`.`id` = `st`.`task_key`
  AND `t`.`step` = `st`.`step`
WHERE
  `t`.`state` IN (...)
  AND `st`.`state` IN (...)
  AND `st`.`exec_id` = ?
GROUP BY
  `t`.`id`
ORDER BY
  priority ASC,
  `create_time` ASC,
  `id` ASC

Kongdom · 2025 年8 月 18 日 02:51

这个是分布式执行框架里的，是不是有ddl语句在执行？
https://docs.pingcap.com/zh/tidb/stable/tidb-distributed-execution-framework/#tidb-分布式执行框架-dxf

CAI001 · 2025 年8 月 18 日 02:55

我看指标图已经持续了三四天了，应该不是ddl语句，ADMIN SHOW DDL JOBS; 命令也没查到有卡住的DDL

db_user · 2025 年8 月 18 日 03:28

看下analyze的时间点，show analyze status,是不是有analyze执行失败的情况，另外调整下analyze的时间观察下cpu有没有明显下降，先排查下是否为analyze的问题

CAI001 · 2025 年8 月 18 日 04:57

analyze 的时间都在很短时间内完成，耗时最长的3s，大部分都砸1s内完成。没有异常状态的。

nobody · 2025 年8 月 18 日 05:03

通过 dashboard 分析一下内存高的节点的火焰图。参考如下文档
https://docs.pingcap.com/zh/tidb/stable/dashboard-profiling/

CAI001 · 2025 年8 月 18 日 05:27

像是统计信息和session相关的占用比例较高

13.72 GB (67%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/util.(*WaitGroupEnhancedWrapper).Run.func1
13.34 GB (65%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/session.(*session).ExecuteStmt
12.86 GB (63%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/statistics/handle/util.CallWithSCtx
12.58 GB (62%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/session.(*session).withRestrictedSQLExecutor
12.58 GB (62%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/session.(*session).ExecRestrictedSQL
12.03 GB (59%)	18.00 MB (0.09%)	github.com/pingcap/tidb/pkg/session.(*session).ExecRestrictedSQL.func1
11.65 GB (57%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/domain.(*Domain).loadStatsWorker
11.54 GB (57%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/session.(*session).ExecuteInternalStmt
11.53 GB (57%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/statistics/handle/util.ExecRowsWithCtx
11.52 GB (57%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/statistics/handle/util.ExecRows
11.36 GB (56%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/statistics/handle/util.WrapTxn
11.16 GB (55%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/statistics/handle/storage.(*statsReadWriter).LoadNeededHistograms
10.29 GB (50%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/statistics/handle/storage.LoadNeededHistograms
10.29 GB (50%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/statistics/handle/storage.(*statsReadWriter).LoadNeededHistograms.func1
10.15 GB (50%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/statistics/handle/storage.loadNeededColumnHistograms
9.86 GB (48%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/statistics/handle/storage.HistogramFromStorageWithPriority
9.14 GB (45%)	14.50 MB (0.07%)	github.com/pingcap/tidb/pkg/executor.(*Compiler).Compile
8.81 GB (43%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/planner.Optimize
8.81 GB (43%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/planner.optimize
5.53 GB (27%)	8.00 MB (0.04%)	github.com/pingcap/tidb/pkg/planner/core.doOptimize
5.53 GB (27%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/planner/core.DoOptimize
5.37 GB (26%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/planner/core.physicalOptimize
4.55 GB (22%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/util.(*WaitGroupWrapper).Run.func1
3.95 GB (19%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/disttask/framework/storage.(*TaskManager).WithNewSession
3.88 GB (19%)	313.12 MB (1.5%)	github.com/pingcap/tidb/pkg/session.createSessionWithOpt
3.86 GB (19%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/util.(*pool).Get
3.85 GB (19%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/session.createSession
3.85 GB (19%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/session.(*domainMap).Get.func1.createSessionFunc.1
3.67 GB (18%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/planner/core.findBestTask
3.67 GB (18%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/planner/core/operator/logicalop.(*BaseLogicalPlan).FindBestTask
3.56 GB (17%)	5.00 MB (0.02%)	github.com/pingcap/tidb/pkg/planner/core.enumeratePhysicalPlans4Task
3.55 GB (17%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/planner/core.iteratePhysicalPlan4BaseLogical
3.44 GB (17%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/disttask/framework/storage.(*TaskManager).ExecuteSQLWithNewSession
3.41 GB (17%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/planner/core.findBestTask4LogicalDataSource
3.41 GB (17%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/planner/core/operator/logicalop.(*DataSource).FindBestTask
3.27 GB (16%)	3.50 MB (0.02%)	github.com/pingcap/tidb/pkg/session.runStmt
3.23 GB (16%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/planner.buildLogicalPlan
3.22 GB (16%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/planner/core.(*PlanBuilder).Build
3.21 GB (16%)	0 B (<0.01%)	github.com/pingcap/tidb/pkg/executor.(*ExecStmt).Exec
3.19 GB (16%)	975.82 MB (4.7%)	github.com/pingcap/tidb/pkg/planner/core.convertToIndexScan
3.18 GB (16%)	50.50 MB (0.24%)	github.com/pingcap/tidb/pkg/planner/core.(*PlanBuilder).buildSelect
3.08 GB (15%)	2.97 GB (15%)	github.com/pingcap/tidb/pkg/sessionctx/variable.NewSessionVars

nobody · 2025 年8 月 18 日 06:00

可以发一下文件吗？

CAI001 · 2025 年8 月 18 日 06:03

发不出去

WalterWj · 2025 年8 月 18 日 07:12

重启 tidb server 应该能解决
尽快升级到 853 版本吧。

CAI001 · 2025 年8 月 18 日 07:27

重启可以应该是可以解决问题

CAI001 · 2025 年8 月 18 日 08:14

是版本有bug吗？

WalterWj · 2025 年8 月 19 日 01:20

去 tidb 日志里面，搜索下 memory quota 类似关键字，是不是在频繁触发 tidb 的内存管理。

推测就是 tidb 内存用的多，触发内存管理杀 sql，实际上没有啥 sql 能杀。一直在这个逻辑里面导致 cpu 高。重启释放掉内存即可。
本质问题应该是内存使用不合理或者内存溢出了。