tidb启动不起来

【 TiDB 使用环境】测试
【 TiDB 版本】
V6.5.0
【复现路径】做过哪些操作出现的问题
单机部署, 3个tikv节点, 机器更换了IP地址后, 无法启动
【遇到的问题:问题现象及影响】
无法启动tidb
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
无法进入dashboard, 登录提示:
Sign in failed: No alive TiDB instance
【附件:截图/日志/监控】
使用tiup启动超时, 最后报错:
Starting component pd
Starting instance 10.11.31.237:2379
Start instance 10.11.31.237:2379 success
Starting component tikv
Starting instance 10.11.31.237:20162
Starting instance 10.11.31.237:20160
Starting instance 10.11.31.237:20161
Start instance 10.11.31.237:20161 success
Start instance 10.11.31.237:20162 success
Start instance 10.11.31.237:20160 success
Starting component tidb
Starting instance 10.11.31.237:4000

Error: failed to start: failed to start tidb: failed to start: 10.11.31.237 tidb-4000.service, please check the instance’s log(/opt/apps/tidb-deploy/tidb-4000/log) for more detail.: timed out waiting for port 4000 to be started after 2m0s

tidb.log 反复报这个错误

[2024/03/14 19:01:57.412 +08:00] [WARN] [backoff.go:158] [“pdRPC backoffer.maxSleep 40000ms is exceeded, errors:\nregion not found for key "7480000000000000125F6980000000000000010173797374656D5F74FF7A00000000000000F8" at 2024-03-14T19:01:50.298878054+08:00\nregion not found for key "7480000000000000125F6980000000000000010173797374656D5F74FF7A00000000000000F8" at 2024-03-14T19:01:52.646599719+08:00\nregion not found for key "7480000000000000125F6980000000000000010173797374656D5F74FF7A00000000000000F8" at 2024-03-14T19:01:55.010713466+08:00\nlongest sleep type: pdRPC, time: 41591ms”]
[2024/03/14 19:01:57.412 +08:00] [FATAL] [terror.go:300] [“unexpected error”] [error=“[tikv:9001]PD server timeout”] [stack=“github.com/pingcap/tidb/parser/terror.MustNil\n\t/home/jenkins/agent/workspace/build-common/go/src/github.com/pingcap/tidb/parser/terror/terror.go:300\nmain.createStoreAndDomain\n\t/home/jenkins/agent/workspace/build-common/go/src/github.com/pingcap/tidb/tidb-server/main.go:315\nmain.main\n\t/home/jenkins/agent/workspace/build-common/go/src/github.com/pingcap/tidb/tidb-server/main.go:214\nruntime.main\n\t/usr/local/go/src/runtime/proc.go:250”] [stack=“github.com/pingcap/tidb/parser/terror.MustNil\n\t/home/jenkins/agent/workspace/build-common/go/src/github.com/pingcap/tidb/parser/terror/terror.go:300\nmain.createStoreAndDomain\n\t/home/jenkins/agent/workspace/build-common/go/src/github.com/pingcap/tidb/tidb-server/main.go:315\nmain.main\n\t/home/jenkins/agent/workspace/build-common/go/src/github.com/pingcap/tidb/tidb-server/main.go:214\nruntime.main\n\t/usr/local/go/src/runtime/proc.go:250”]

有大佬在吗?求助…

TiDB Server到PD不同,更改IP后,所有的配置都更改了吗?

meta 文件没改吧? 参考这个链接操作下: 专栏 - 机房搬迁更改集群IP | TiDB 社区

1 个赞

ip更改后,配置文件内容做了哪些处理,看下配置

timed out waiting,应该是配置没有配完,仔细检查下。

PD集群是不是正常的,这里访问pd超时了。你更换ip的操作是什么样子的

建议先回退操作,用回原来的ip先恢复集群。

然后建议使用扩容新ip,再缩容旧ip的方式实现,这样可以在线替换整个集群的ip

1 个赞

扩容缩容建议

单机部署别用真实ip啊,参考我装的用127.0.0.1地址,装好了其他机器也能连。要不换了IP很麻烦

都改了哪里呢

检查一下PD状态,查看下错误日志

看着是获取pd 超时

换ip没那么简单的,需要参照 专栏 - 机房搬迁更改集群IP | TiDB 社区处理

meta.yaml信息可能没修改,检查下

1 个赞

专栏 - 现网修改TiDB集群IP和端口 | TiDB 社区 可以参考下这篇文章。

参考下 TiUP 修改集群 IP(基于版本V6)