TiDB和PD有三个节点,临时下线一个节点,稍后在恢复,有什么风险?

【TiDB 使用环境】生产环境
【TiDB 版本】v6.1.0
【操作系统】CentOS Linux release 7.9.2009
【部署方式】机器部署
【集群数据量】
【集群节点数】TiDB
【问题复现路径】
【遇到的问题:问题现象及影响
当前集群有TiKV节点4个,TiDB和PD节点3个,现在有一台机器需要迁移重启,这台机器上有一个TiDB节点和PD节点(看了下不是leader),不新增节点的情况下,临时停掉这台机器上的TiDB和PD节点,等机器迁移重启好了(大概需要12个小时)在启动台机器两个节点有什么风险吗?有没有什么推荐的操作方案步骤?


注意下 max-store-down-time 的参数值,这个默认30分钟。不考虑缩容的情况下,建议把这个参数设置的大于停机时间。

不停 tikv 节点的话,不用考虑 max-store-down-time ,注意前面的业务别连到 停掉 的 tidb-server 即可

对,确实,我脑子抽了,hh

注意点可以参考这个文章
【SOP 系列 06】临时关机维护某线上主机.

1 个赞

pd 非leader节点随便停,tidb-server的话,只要你没配置业务只连这一个节点,也是随便停的

风险就是pd停的时间内不要再有其他的pd节点出现down的情况。

如果某个tidb节点连不上会连到其他tidb吗

:thinking:这种情况有风险,但概率非常非常低。可以放心迁移。

有负载的情况下,会连其他的,没有负载的情况下不会连其他的。前提是应用连的是负载ip,不是具体节点ip

tidb服务做了负载均衡的话,就没什么风险

tidb server是无状态的,只要前面应用做了负载均衡,是没有任何风险的。
pd server的话,3个节点停掉一个,还是多数存在,一般也不会有任何风险的。

停一个没问题

重启一个KV节点没多大风险

pd不是leader的话,影响不是很大。

停一个没什么问题吧