Unsafe recovery 一直处于运行状态

你的理解可能有点问题。所有的tikv都掉线是没法从unsafe recovery恢复的,只能从br备份恢复。

在3副本的情况下,丢失1个副本,pd会调度其他还有空间的tikv补副本回到3副本的状态,这个不需要人工干预。
但是丢失2个副本,则会造成raft组已经不能保证多数派在线,会导致集群不可用。这个时候没法做到无损恢复,必须人工干预。这个人工干预的方法就是unsafe recovery。丢失的数据就是leader 到follower之间的这一小段。

所以当你的tikv全部掉线,unsafe recovery是没有办法完成的。你起码要保证1个副本能用,才能用unsafe recovery的方法,以丢失小部分数据为代价从1副本恢复到3副本。

在tikv全掉的情况下,只能通过br的pitr备份来恢复了。