TIDB 中ddl语句被阻塞，后台一直有ddl job处于cancelling状态中

erwadba · 2020 年5 月 15 日 02:15

【**系统版本 **】CentOS Linux release 7.5.1804 (Core)

【 TiDB 版本 】

【 集群节点分布 】

【 问题描述 】
在tidb命令中执行ddl命令，使用了ctrl+c终止，然后使用kill tidb id操作。最后使用 admin cancel ddl jobs

tidb errlog截图如下：

有知道怎么强制删除某个ddl的操作吗？
【 关键词 】DDL， TIDB， cancelling

小王同学 · 2020 年5 月 15 日 02:38

您好，取消 DDL 操作只能用 cancel 来操作，详细内容可查看官网，https://pingcap.com/docs-cn/stable/sql-statements/sql-statement-admin/

erwadba · 2020 年5 月 15 日 02:42

cancel ddl jobs执行时间这个可控吗？从截图来看，cancel ddl jobs，有的执行时间挺短的。有的执行时间特别长。像目前这种后续ddl执行不了情况，就只能一直等着？

小王同学 · 2020 年5 月 15 日 03:04

分 DDL 类型，如果是 add index 会比较慢。还有 DDL 也是放在队列里，后面的要等前面的执行完才能跑，所以后面的等待时间会久一些。可以详细看下 DDL 源码解析这块内容。
https://pingcap.com/blog-cn/tidb-source-code-reading-17/

wink · 2020 年5 月 15 日 03:53

curl http://{TiDBIP}:10080/info

curl http://{TiDBIP}:10080/info/all

能否看看这个的返回结果呢

AilinKid-PingCAP · 2020 年5 月 15 日 04:03

kill -9 tidb 之后，可能导致 TiDB 没有及时从 PD 清理注册数据，在同步 schema 状态的时候，会等待 lease 超时才会认为 ddl 执行成功。lease 等待是 ddl 慢的原因。

该下线的 tidb 在 pd 侧的注册信息会在一段 timeout 之后被 pd 自动清理，届时，ddl 同步会正常

可以拿下上述的消息，看下 owner 的状态

curl http://{TiDBIP}:10080/info

curl http://{TiDBIP}:10080/info/all

tiancaiamao · 2020 年5 月 15 日 04:18

跟这个可能是同一个问题

wjhuang2016-PINGCAP · 2020 年5 月 15 日 04:21

@erwadba 您好，能否提供下 tidb 的日志？我们确认下是不是 @tiancaiamao 提到的已知问题。

erwadba · 2020 年5 月 15 日 04:36

AilinKid-PingCAP · 2020 年5 月 15 日 04:55

多谢反馈，看起来 tidb owner 是正常的，抱歉能够辛苦再提供下 pd 和 tidb 两端的日志，这个问题看起来和上述那个问题不太像，谢谢

erwadba · 2020 年5 月 15 日 05:42

链接: https://pan.baidu.com/s/18xsIx98pCRLgmkZsYP8XGA

提取码: 3xd3

tidb+pd+tikv的日志都在里面

AilinKid-PingCAP · 2020 年5 月 15 日 06:32

您好，看了 tidb error log 发现

确认是跟 TiDB 4.0-RC 执行创建数据库的语句不返回！ - #27，来自 zyw8136 一样的问题。

这边方便的可以做下升级，或者将 superBatch 关掉

#Max batch size in gRPC.

max-batch-size = 128

可以将该参数设置成 0。。。但性能会有下降，最好升级

erwadba · 2020 年5 月 15 日 06:58

好的，谢谢后面尝试升级

Lucien-卢西恩 · 2020 年5 月 15 日 09:25

感谢反馈，如果您有其他的问题，麻烦创建新的问题帖子。

system · 2022 年10 月 31 日 19:15

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。