TIDB集群断电问题咨询

【 TiDB 使用环境`】生产环境
【 TiDB 版本】


【遇到的问题】
老师们好,近期我们机房一个交换机出现问题,现需要更换交接机(TIDB集群所在交换机),更换交换机过程中会断网,TIDB整个集群断网(大概10-20分钟),我想问下老师们 这个操作对TIDB有什么影响? 需要注意些什么?需不需要提前对集群配置(超时啊存活检测时间啊啥的)做一些修改呢? 谢谢~~

这种场景就是停机维护,先把整个集群停掉即可。

1 个赞

给交换机上个 ups 吧… :joy:

超过 半个小时,基本上 raft 的版本没办法追赶了,会演变成 snapshot 的版本追赶,达到一定的水平对齐后,才会追到 raft log

这期间可能集群不可访问,或者访问超慢…

1 个赞

ups是备用电源吗? 这不是一个问题吧,我们是换交换机啊

我们这情况,是不是得有交换机热备,才会不会影响 业务 吧?

对阿,备用电源阿,一个小型的,够撑几个小时了

1 个赞

关闭集群: tiup cluster stop ${cluster-name}
更换完后启动集群: tiup cluster start ${cluster-name}
老师以上操作没错吧?

是的,就是这两个命令
https://docs.pingcap.com/zh/tidb/stable/maintain-tidb-using-tiup

1 个赞

好的,thanks~

把整个集群停掉把 这样最保险。
之前没遇到过这种问题。我是遇到了tikv下线 被删除这种情况

停机前先做好备份吧,有备无患

物理备份快,逻辑备份好恢复单表

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。