服务器操作系统损坏,异机拷贝data目录覆盖到现有TiDB服务器后无法正常启动服务

【 TiDB 使用环境】生产环境
【 TiDB 版本】
【复现路径】服务器无辜无法远程ssh,重启后无法开机,通过云平台将磁盘对应tidb的data目录拷贝出来到新服务器,新服务器无法正常启动tidb服务
【遇到的问题:问题现象及影响】 新机器使用默认的data目录,无论是docker启动,还是安装版启动均正常;一旦将原服务器的data目录覆盖过去后就无法正常启动,以下是部分错误截图

麻烦各位大神帮忙解决下,有偿!

没有这样操作的,都是扩缩容解决的

etcd 的 cluster id 不匹配,无法加入到 etcd 集群,你要详细描述下你部署方式,故障情况,以及你故障后做的操作

之前的服务器是docker方式部署的,将data目录挂载出来了。故障情况就是服务器操作系统无法开机了,故障后尝试用docker启动一个新的tidb服务,将原data目录还原过来,但是这样无法启动tidb服务(docker和安装版两种都尝试过了)。不知道是否还有没有其他方式来恢复数据。

docker 方式咋安装的,官方文档上有 docker 安装方式嘛

有的 ,docker-compose方式

这里有写 WARNING: This is for testing only, DO NOT USE IN PRODUCTION!

就是后面没有迁移

不懂这种部署方式,正常来说,你把 data 还原后,再启动服务,还是原来的数据,应该能启动的啊,现在报不同的 cluster id,是不是有的容器磁盘没映射过去啊

data目录确认都拷贝出来了

建议先scale-out,在scale-in

新启动的容器,目录映射都对了嘛

您是指扩容吗?适合我这种恢复数据的方式吗,具体怎么操作呢,是否可以指导下,可以加微信:zhaotianblog,有偿提供帮助。

恢复好了吗

还没哦

总数据量多吗

data目录(pd+tikv)一共有15G

日常备份也没有做?

居然敢使用docker做生产环境?

[2024/09/21 18:14:57.662 +08:00] [INFO] [raft.rs:1127] ["became follower at term 14"] [term=14] [raft_id=17] [region_id=16]
[2024/09/21 18:14:57.662 +08:00] [INFO] [raft.rs:388] [newRaft] [peers="Configuration { incoming: Configuration { voters: {17} }, outgoing: Configuration { voters: {} } }"] ["last term"=14] ["last index"=67] [applied=67] [commit=67] [term=14] [raft_id=17] [region_id=16]
[2024/09/21 18:14:57.662 +08:00] [INFO] [raw_node.rs:315] ["RawNode created with id 17."] [id=17] [raft_id=17] [region_id=16]
[2024/09/21 18:14:57.662 +08:00] [INFO] [raft.rs:1532] ["starting a new election"] [term=14] [raft_id=17] [region_id=16]
[2024/09/21 18:14:57.662 +08:00] [INFO] [raft.rs:1177] ["became pre-candidate at term 14"] [term=14] [raft_id=17] [region_id=16]
[2024/09/21 18:14:57.662 +08:00] [INFO] [raft.rs:1151] ["became candidate at term 15"] [term=15] [raft_id=17] [region_id=16]
[2024/09/21 18:14:57.662 +08:00] [INFO] [raft.rs:1235] ["became leader at term 15"] [term=15] [raft_id=17] [region_id=16]
[2024/09/21 18:14:57.662 +08:00] [INFO] [peer.rs:267] ["create peer"] [peer_id=19] [region_id=18]
[2024/09/21 18:14:57.663 +08:00] [FATAL] [server.rs:1155] ["failed to start node: Engine(Other(\"[components/raftstore/src/store/fsm/store.rs:1211]: \\\"[components/raftstore/src/store/entry_storage.rs:650]: [region 18] 19 validate state fail: Other(\\\\\\\"[components/raftstore/src/store/entry_storage.rs:465]: log at recorded commit index [14] 3304304 doesn't exist, may lose data, region 18, raft state hard_state { term: 14 vote: 19 commit: 3304074 } last_index: 3304075, apply state applied_index: 3304304 commit_index: 3304304 commit_term: 14 truncated_state { index: 3304302 term: 14 }\\\\\\\")\\\"\"))"]