【TiDB 版本】 7.5.5版本
【操作系统】 麒麟v10
昨天在一台服务器上部署了一个单机版,部署后也是启动起来了,操作都没问题,然后reboot重启了几次服务器,然后就关机了,今天启动服务器后发现数据库启动不了了,报错如下:
日志输出了这个
配置按的是 [在单机上模拟部署生产环境集群] 这里写的,请问这个问题是因为关机导致的吗?应该怎么处理?
pd的log里一直刷这个
【TiDB 版本】 7.5.5版本
【操作系统】 麒麟v10
昨天在一台服务器上部署了一个单机版,部署后也是启动起来了,操作都没问题,然后reboot重启了几次服务器,然后就关机了,今天启动服务器后发现数据库启动不了了,报错如下:
感觉是有些服务没起来
哪些?该怎么解决
可能是IP问题吧,就算用本地,也要用正常的ifconfig的ip地址。为什么用127.0.0.1呢。如果这么用。假想一下。集群中所有信息地址都是127.0.0.1 怎么划分,肯定就乱了
那如果我ip是192.168.1.1 ,那我tidb pd kv 也都是配置的host: 192.168.1.1 呀,而且数据库我昨天也是正常跑起来了的,而且关机几次再重启也是服务自动就起了,没什么问题,就今天开机时突然数据库就起不来了
tiup cluster display tidb_topo看下,正常tidb集群的启动顺序是pd→tikv→tidb-server,你现在显示pd起来了,但是tikv启动时连接pd失败了,你先确认pd是真的起来了,然后排查tikv连接pd失败的原因。最好也看下pd的日志。
看一下PD的日志。有什么输出。你得这个配置是多少。看看 /VAR/LOG/MESSAGE 系统日志有没有相关日志输出
你现在就是pd起不来了,单机环境不太好搞了,要是有其他pd节点,直接切了,重新缩容扩容一个pd节点就行。。。试一下整个步骤吧。https://docs.pingcap.com/zh/tidb/v6.5/pd-recover/#方式二完全重建-pd-集群
额… 就没有具体的解决办法吗,现就一台服务器搞呀
参考这个,不过他是正规的3节点pd全挂了,你的就一个挂了就相当于这个了。。。 专栏 - 使用pd-recover 恢复pd 多数节点故障的场景 | TiDB 社区
虚拟机?pd 的文件似乎损坏了
是虚拟机,然后我重复启动,这文件就坏了?
数据库是这种软件对数据一致性要求很高的,虚拟化层可能有些设置会导致 IO 没有落盘,当崩溃时写入丢失,从而导致数据不一致
服务器重启只有应该会自动启动吧,是不是自动启动和手工启动冲突了?先手工stop,然后看看进程里有没有tidb相关进程,如果没有,再手工start试试。