tidb集群服务器单网卡改bond,集群通信有问题

【 TiDB 使用环境】测试/
【 TiDB 版本】7.1.1
tidb集群,tiflash物理机单网卡,运行正常,停止tidb数据库集群,在tiflash节点进行双网卡绑定,网络层面没问题,但集群运行查询后,tiflash失去连接,查询报错


总结:
对已有的集群,是不能改网络配置吗?

tiflash节点的状态还正常吗?

改网络配置后,启动正常,查询一段时间才报错,查看集群状态,发现tiflash失去连接

首选双网卡绑定采用模式6,出现问题后,以为不支持模式6

第二次,双网卡绑定模式改为1,还是一样的故障

最后改为单网卡配置,也是一样的故障,没办法,重装集群试试

已经上线的集群,如果要修改IP 有点小复杂,参考 专栏 - 机房搬迁更改集群IP | TiDB 社区

如果是测试环境,建议重装得了…

IP没变,只是网络模式改变,mac地址有变化

你说的重装,是tidb集群重装,不是整个操作系统也需要重装吧

就是缩容再扩容有问题的节点,建议有问题的操作系统也重装,另外把各种网络监控都加上

集群重装就行了,但是要清理干净留存的文件,避免会引发其他的问题

修改ip之后应该是找不到对应的登录密钥了,个人觉得可以尝试踢出节点,新增节点

你先通过中控机能正常ssh登陆tiflash节点的机器吗?可以的话,可以先踢掉一个节点,例如14.3的,然后再扩容14.3的tiflash看下

按照正常的缩容,再扩容的方式处理一下,看看

bond了,交换机上也得配置

我怎么感觉是 bound 操作有问题 :thinking:

IP 变了?

建议先验证下tiflash的IP+端口的连通性,如果TCPIP不通可以重点关注bond的配置。