不输土豆
(Ti D Ber Lkg Kt Rt P)
1
【TiDB 使用环境】生产环境
【TiDB 版本】v8.5.1
【操作系统】ubunut 20.04
【部署方式】云上部署(什么云)/机器部署(什么机器配置、什么硬盘)
【集群数据量】
【集群节点数】
【问题复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
执行tiup cluster scale-in prod-cluster -N ip:4000–force 时,会卡在 stopping instance阶段,如图
无法缩容掉tidb-server 结点。机器已经异常了,怎样才能直接下掉这个服务。
现在好像不是优雅不优雅的问题,是没有办法停掉这个tidb-server
有没有人帮忙看看呀,其他的扩缩容操作,都会因为这个机器卡住。

【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【复制黏贴 ERROR 报错的日志】
【其他附件:截图/日志/监控】
tidb-server的话,你不连他不就相当于缩容了?或者把机器关了
从负载均衡踢出来,直接tiup cluster scale-in prod-cluster -N ip:4000–force
asmile
(TiDBer 叶明)
4
你服务正常,tidb 其他节点应该是能和这台机器通信的,你可以 ssh 到其他机器,再去下线它吧
不输土豆
(Ti D Ber Lkg Kt Rt P)
5
上面截图,就是tiup cluster scale-in prod-cluster -N ip:4000–force 时, 卡住了。估计这个stoppng 操作是需要登录机器,停掉 tidb-server 服务,但是现在这个机器登录不了了。
正常强制缩是不需要连接到目标服务器的,我之前有台服务器坏了磁盘都被格式化了,也是这样–force缩掉的
1 个赞
你看我这个操作,确实有stop操作,也失败了,但是没关系的。
不输土豆
(Ti D Ber Lkg Kt Rt P)
8
我的和你的情况应该不一样。我的stoping 应该是卡在了 ssh 阶段,所以一直卡着
小龙虾爱大龙虾
(Minghao Ren)
11
机器是啥状态, tidb server 是无状态的,你机器挂了,它相当于自动从集群中踢出去了
只是 tiup 里元数据还有它而已
asmile
(TiDBer 叶明)
12
可是如果其他机器也无法 ssh 登录这台机器,那这台机器应该无法正常服务才对吧
不输土豆
(Ti D Ber Lkg Kt Rt P)
13
可以正常服务,机器现在是异常状态。机器无法登录,但是上面的服务是正常的。
CC噶勒鸡
(Ti D Ber 0 I Fh E Gc Y)
14
基本关机之后, tidbserver这种无状态的组件直接–force缩容掉是不会有影响的呀
不输土豆
(Ti D Ber Lkg Kt Rt P)
15
如描述中的截图,加了 --force 的缩容操作,也是一直卡住,进行不了。
清风明月
17
这个在下线需要等一段时间,可以看下相关的日志是否有报错。