DDL卡住不动

【 TiDB 使用环境】生产环境
【 TiDB 版本】 5.2.2
【遇到的问题】 ddl执行到一个点卡住很久不动
【复现路径】创建索引ddl
【问题现象及影响】
表大概1700W左右数据,添加一个索引到1400w左右后卡住了半小时未动


查看ddl worker日志也没错误

【附件】

1 个赞

先检查下是不是数据版本是不是太多了,gc没有清理
前几天刚有一个帖子讨论过这个问题
900w表添加索引超过一天还没执行完,如何排查? - TiDB - TiDB 的问答社区 (asktug.com)

GC当时是10分钟,也没有大量的数据版本。

按帖子操作了也不可以

看你在另外一个帖子讨论了,解决了没:grin:

1 个赞

感觉这个问题好普遍呀,看到好几个人都有这个问题发生。

1 个赞

对于表中已有数据的时候,添加索引会有索引重建的步骤,如果嫌慢可以调整回填的速度,当然,这对集群会有非常大的性能影响…

试过了3次了,参数也调整了 没有用,都是卡在截图那块不推进了。

取消了,重来试试

试了3次,每次等了几个小时都不行

在建个结构相同的表,把索引都建好,把数据搬过去… 在删掉原表,在改名…

这种是否可以做个会话跟踪或者Linux进程跟踪,看下卡到哪里了?

我感觉这个问题,还是受 Bug 影响了,有机会的话,升级到 5.2.4 吧
我说的办法能帮助你跳过去…
但是要完全解决,还是得升级…

咱们的升级会引入新的哪些问题么,感觉我遇到的问题全需要升级才能解决。 我查了下5.2.4修复列表没看到这个bug的修复。



都是数据处理的老毛病了 :rofl:

推荐到 5.2.4 ,是修复了一些已知的问题

1 个赞

我之前还有5.0.6版本的升级版本跨度太大的话担心有额外的bug,不知道能升级到哪个版本合适

担心的话,可以在找资源搭建一套,POC 一把,以评测结果为准~

这个时间和成本也是个问题,集群较大 50T 以上。 就为了加一个索引动作太大了。:innocent:

:+1::+1::

刚刚整理出来的,可以参考下