在用TiDB集群需要进行网络升级,如何保证服务器IP修改后继续对外提供服务?如果服务器IP不变,是否逐个修改服务器的新网口,不影响在用服务?

目前我们部署了一套六节点的TiDB集群,三个TiDB和三个PD部署在同服务器上,三个TiKV单独部署。

服务上线后,发现两台服务器网络一直居高不下,大约维持在920Mb/s,严重影响数据写入性能,系统延时高达8s。因此我们现在希望做网络升级。

目前有两种方案: 一是重新找一台万兆交换机,将现有六节点接入到新的交换机上,但是IP不需要修改。我的疑问是,如果我逐个修改服务器新网口IP的话,是不是不影响服务的使用?还是需要先将所有服务关闭,配置好新的网口后,再重新启动。(这种方案已经使用了,没有问题的,顶多网卡重启时中断一下服务,对我们没有太大影响)

二是将所有服务器搬至另外一个万兆网络机房,这一过程需要将每一台服务器的IP都修改为新的IP,这种情况下,又该怎么修改,使得服务能够正常启动并对外提供服务?

如果第一种方案不需改 IP 的话,我比较倾向第一种方案,因为这种方案不可用时间短。 对于一个不能停服的服务来讲,换交换机这种操作,比较常见,最多插拔光纤时闪断一下。 当然,得事先把新交换机配好,并接入到网络中。

2赞

第一种最近就要操作。但是第二种早晚也要面临。

您的意思是,服务不需要重启,只要把网卡重启就行是吧。那所有服务器网卡重启和逐个网卡重启,区别大吗?

一次只能操作一跟光纤吧?这是物理光纤插拔,不是重启 network。

#事先把第二台交换机加入网络并调通

情况咋样了。

第一种直接更换交换机 已经实现,没有影响业务。

第二种方案,希望官方给出解决方案,目前无法操作。

第一种,方案优势楼上说的比较明显 第二种: 1、如果有多余的机器,可以通过扩缩容方式,自动搬迁 2、如果没有多余机器,需要一台台方式操作(本质还是扩缩容方式),比如: TiKV,先缩容一台,然后修改主机IP,扩容进去,但是建议TiKV 能多余出一台机器比较好,意思是 TiKV,缩容前先扩容一台,尤其 PD ,再缩容前必须多一台,因为 PD 变更需要滚更整个集群,先缩容 PD 剩下两个PD,滚更有风险 3、停机变更,直接修改服务器相关IP

1赞

感谢您的回答。因为我们两个机房相隔较远,服务器也不多,因此所有的服务需要全部下线然后关机,再将所有服务器搬至新机房。请问只需要把inventory.ini修改,然后滚动更新就可以了吗?您有操作过吗?

因为我们两个机房相隔较远,服务器也不多,因此所有的服务需要全部下线然后关机,再将所有服务器搬至新机房

看你意思是整个服务器机器搬迁到新机房,不是所有服务一次全部下线: 1、集群停机,修改 inventory.ini , 然后 deploy ,再修改服务器 IP,重新互信,再 start(可能停机时间长,一次性全变更,不好把控) 2、像之前说得集群扩缩容,PD 缩容前先扩

具体根据你这边情况选择然后充分测试,任何生产集群操作,都应充分测试

生产环境不敢动,之前在测试环境测试扩容缩容的时候,一次多操作了几个几点,最后整个集群都起不来了:sob: