modify column执行时间过长

Kongdom · 2023 年10 月 16 日 02:32

比如GC这些操作呢？我觉得这是一个怀疑点~

Leonard · 2023 年10 月 16 日 02:34

原来是24h, 我也怀疑过这个问题，所以在执行到50多亿时候，我就修改gc 到30min 了。但是现在还是到了80 多亿

Kongdom · 2023 年10 月 16 日 02:35

我的意思是GC导致dll进程报错重试，然后又从头开始，但计数没有清零。

Leonard · 2023 年10 月 16 日 02:38

但是不知你说这种情况如何证明

Kongdom · 2023 年10 月 16 日 02:59

抛开过程不谈，最终这个dll执行成功了么？表字段修改了么？

dba-kit · 2023 年10 月 16 日 03:02

看下当前的集群的reorg配置是多少？是不是分配的资源太少了？

mysql> show variables like '%reorg%';
+----------------------------+--------------+
| Variable_name              | Value        |
+----------------------------+--------------+
| tidb_ddl_enable_fast_reorg | ON           |
| tidb_ddl_reorg_batch_size  | 256          |
| tidb_ddl_reorg_priority    | PRIORITY_LOW |
| tidb_ddl_reorg_worker_cnt  | 8            |
+----------------------------+--------------+
4 rows in set (0.00 sec)

芮芮是产品 · 2023 年10 月 16 日 03:33

4-5天明显就是挂了

Leonard · 2023 年10 月 16 日 03:34

5天前我自己重启的

Leonard · 2023 年10 月 16 日 03:34

Leonard · 2023 年10 月 16 日 03:35

现在取消重新跑了。取消过程很快就完成了。

Leonard · 2023 年10 月 18 日 02:16

2023-10-16 11:15:31 重新跑的，现在28亿了，还是没跑完哦

h5n1 · 2023 年10 月 18 日 02:23

这2个参数调大能让回填过程快一些，你的gc时间设置多久，pd-ctl service-gc-safepoint --pd pd_addr 看下

路在何chu · 2023 年10 月 18 日 02:27

是不是你加了after的原因

Leonard · 2023 年10 月 18 日 02:48

Leonard · 2023 年10 月 18 日 03:00

tidb_ddl_reorg_batch_size 调为了 1024
tidb_ddl_reorg_worker_cnt 调为了 32
是立即生效的吧

h5n1 · 2023 年10 月 18 日 03:09

设置后会持久化，在下一批数据中生效。看safepoint时间，好像DDL并没有对它造成影响

mono · 2023 年10 月 18 日 05:40

跑完了没？

Leonard · 2023 年10 月 18 日 05:47

没有，取消了

Kongdom · 2023 年10 月 18 日 06:26

取消完成的快么？

Leonard · 2023 年10 月 18 日 07:14

取消很快