tidb-server启动失败

【 TiDB 使用环境】测试
【 TiDB 版本】v6.0.0
【复现路径】做过哪些操作出现的问题

【遇到的问题:问题现象及影响】

虚机发生过物理服务器漂移,重启集群报错如下:

集群状态如下:

/tidb/tiup/logs/tiup-cluster-debug-2024-04-02-10-37-00.log日志如下:

/tidb/tidb-deploy/tidb-4000/log/tidb.log日志如下:

tidb最后的fatal日志呢

tiup cluster display 是什么状态

忘了补充

你 tidb 能访问 13 的 20160 端口么?

不能访问pd?你手动访问下pd,执行下store,看看能正常吗?
另外,只有2个tikv吗?

1 个赞

1.网络延时 不稳定, 检查网络/端口.
2.服务器资源问题。
3.检查配置,比如拓扑。尤其自定义的项目。

宕机时间太长,踢出集群了吧!

先检查下网络都互通吗,一个一个机器互相ping

为何都是2个节点的,没有高可用啊。
最简单的办法可以吧挂掉的pd和tidb节点直接缩掉再扩容。

可以检查下 swap,防火墙,selinux是不是在重启后 设置的跟之前不一样。

机器网络是不是通的,看图里的kv个数也不对,怎么成两个了

虚机发生过物理服务器漂移,重启集群报错如下:

这是什么意思?服务器的ip变更了?

tidb 访问 13不通:

但是13的端口是有的,看集群状态也是启动的:

vm漂移,IP没变

是不是网络策略发生了改变,排查一下呢

tidb访问13的 22端口是通的

另一个tikv节点12有报错日志:

看看13上的tikv是不是正常运行?如果没运行的话,看看报错。如果在运行的话,检查下网络吧。