dgtgsou
(Neo)
1
【 TiDB 使用环境】生产环境
【 TiDB 版本】生产环境V6.5.5 异机环境V6.5.5
【复现路径】生产BR全备成功,异机全备恢复报错。
【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】
生产环境:3PD\7TIDB 混部署,3TIKV,2Tiflash
异机环境:3PD\3TIDB 混部署,3TIKV,1Tiflash
生产和异机使用的是相同的NFS目录
生产环境备份最后输出的日志
异机环境全备恢复输出的日志
另外:Tiflash里面的表的副本是2,目前看到的好像都是Tiflash里面的表数据没有恢复成功,全是0行。
舞动梦灵
(Ti D Ber Nckmz Hmh)
2
有tiflash 最好一模一样,你这个报错提示的是 没有对应文件。但是备份是完成的,要么是恢复的时候NFS突然闪断,网络问题导致他找不到文件。要么就是Tiflash问题。你先扩容一个tiflash,恢复试试,如果成功了,你在缩容掉也行。
1 个赞
nfs挂载到新环境的kv节点了吗?每个kv都能访问到备份目录吗?
kevinsna
(Ti D Ber P O Zcnp Ja)
6
异机那边的所有的节点都挂载上NFS目录,然后进行恢复操作,保持和生产主机一样
Ming
7
有tiflash的话,需要在tiflash节点也挂上NFS
WalterWj
(王军 - PingCAP)
10
lighting local 模式恢复,也会恢复 tiflash 副本。
舞动梦灵
(Ti D Ber Nckmz Hmh)
12
tiflash也要挂载,这个挂载影响也不大,所以建议所有tidb的服务节点都挂在上,以防万一,反正多挂载几个也没啥影响。最后再去掉也行。 你这个大概率就是 NFS挂载和tiflash问题
在日志里搜下这个sst文件,有没有import file done
dgtgsou
(Neo)
20
好的,多谢大佬,目前全量恢复 成功了。开始恢复增量中
WalterWj
(王军 - PingCAP)
27
WalterWj
(王军 - PingCAP)
28
br 的增量会自己卡 gc。
恢复的时候读取的是你备份 s3,不影响上游写。你要是发现 s3 或者本地盘性能跟不上,优先恢复,暂停应该也行的。
dgtgsou
(Neo)
30