TIDB analyze table 卡住，一直处于运行中

jiangdj1992 · 2024 年4 月 29 日 08:30

【 TiDB 使用环境】生产环境
【 TiDB 版本】4.0.8
【复现路径】analyze table table_name;
【遇到的问题：问题现象及影响】
执行一直运行中，卡住，日志显示执行sql代价比较大
[2024/04/29 15:51:35.217 +08:00] [WARN] [expensivequery.go:168] [expensive_query] [cost_time=60.066512705s] [conn_id=163533] [user=root] [database=teaching_study_muster_wb] [txn_start_ts=0] [mem_max=“0 Bytes (0 Bytes)”] [sql=“analyze table user_learntime”]

集群信息 6TIKV 3PD 3TIDB

h5n1 · 2024 年4 月 29 日 08:34

是不是表mvcc太多了，explain analyze 一个全表扫描sql看看

hacker_77powerful · 2024 年4 月 29 日 08:36

这表才2.3万条啊，竟然卡住了，估计版本太老了吧

jiangdj1992 · 2024 年4 月 29 日 08:38

这个怎么处理呢？ 0行的表都卡住

jiangdj1992 · 2024 年4 月 29 日 08:38

4.0.8版本一直没升级

h5n1 · 2024 年4 月 29 日 08:39

show table xxx regions 或者tikv_region_status 看下这个表多少region

jiangdj1992 · 2024 年4 月 29 日 08:40

jiangdj1992 · 2024 年4 月 29 日 08:47

mysql> show table user_learntime regions;
±----------±----------±--------±----------±----------------±---------------------------±-----------±--------------±-----------±---------------------±-----------------+
| REGION_ID | START_KEY | END_KEY | LEADER_ID | LEADER_STORE_ID | PEERS | SCATTERING | WRITTEN_BYTES | READ_BYTES | APPROXIMATE_SIZE(MB) | APPROXIMATE_KEYS |
±----------±----------±--------±----------±----------------±---------------------------±-----------±--------------±-----------±---------------------±-----------------+
| 285209 | t_984_ | t_986_ | 3813789 | 10 | 3813789, 3866620, 10958513 | 0 | 1683 | 0 | 3 | 40960 |
±----------±----------±--------±----------±----------------±---------------------------±-----------±--------------±-----------±---------------------±-----------------+
1 row in set (0.01 sec)

jiangdj1992 · 2024 年4 月 29 日 08:48

感觉是集群哪里有问题，是每个表都会卡住，而不是某个个例，日志没有看出什么问题，监控看起来似乎也正常

h5n1 · 2024 年4 月 29 日 09:05

能看到每个组件的状态吗，你这版本应该没tiup吧

DBAER · 2024 年4 月 29 日 09:09

https://docs.pingcap.com/zh/tidb/stable/sql-faq#在-tidb-中-auto-analyze-的触发策略是怎样的

是不是这个参数调整过，导致频繁analyze

裤衩儿飞上天 · 2024 年4 月 29 日 09:10

4.0.8里我也碰到过，我就几万条，analyze过不去
你看看你的 auto analyze是不是也停了很久了

我是重启的所有的tidb server，然后就可以了，应该是tidb server 哪儿卡了
没有报错，问题也没法查。

不行就升级吧~:smiling_imp:

jiangdj1992 · 2024 年4 月 29 日 09:21

4.0开始有tiup了，组件都是正常状态

jiangdj1992 · 2024 年4 月 29 日 09:22

确实调整过，时间和阈值都调整了， 0.5->0.3 时间限制范围了

jiangdj1992 · 2024 年4 月 29 日 09:23

你说的现象确实是这样，好久没有analyze了，我是有个应该很快的sql执行花费时间特别久，并且明明是执行中状态，但是processlist里查看是sleep状态，并且到tidb节点卡顿，后来把所有的sleep的进程也kill了，然后就不卡顿了，但是那个sql一直执行不下去

WalterWj · 2024 年5 月 6 日 06:02

推荐升级吧。感觉可能是触发了什么 bug。卡主是不应该的。

这个版本已经 EOL

TiDBer_21wZg5fm · 2024 年5 月 6 日 07:41

服务器资源不足？

zhanggame1 · 2024 年5 月 7 日 09:50

analyze早先版本bug居多

jiangdj1992 · 2024 年5 月 7 日 20:42

重启已经恢复正常，分析也快了不少

TIDB analyze table 卡住， 一直处于运行中

TIDB analyze table 卡住，一直处于运行中