tikv掉线一个导致无法进行DDL

【 TiDB 使用环境】生产环境
【 TiDB 版本】V7.5.1
【复现路径】TIKV掉线一个节点
【遇到的问题:问题现象及影响】tikv掉线一个节点后无法进行DDL操作,将故障节点下线之后。重新执行DDL操作,正常运行
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】

是希望掉一个tikv,ddl不受影响?

7.5.2 修复 TiDB 可能向未准备就绪的 TiKV 发起请求的问题 #50758

2 个赞

:thinking:自问自答么?

是说7.5.1有这个问题,大家注意一下?

这不是故障问题吧

将故障节点下线之后。重新执行DDL操作,正常运行
那这就说明 这应该是一个BUG,正常应该不影响才对,升级版本吧

在TiDB集群中,如果一个TiKV节点掉线,并且这个故障节点没有被及时处理或下线,可能会导致集群中的DDL(数据定义语言)操作停滞。这是因为TiDB的DDL操作依赖于PD(Placement Driver)来协调整个集群的状态变更,而TiKV节点是存储层的一部分,负责实际的数据存储。

在有节点问题的时候,尤其是tikv,最好别搞ddl了,乱

只掉线一个,就需要去下线对应节点是不是不太友好

是的就是希望这样

1 个赞

嗯,应该就是二楼说的那个bug

你的意思是希望让tidb内核做一些重试策略【添加重试间隔和重试次数】,避免在tikv实例短暂异常期间ddl任务不中断吧

应该是上面提到的7.5.2修复的bug

此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。