BR 恢复失败 split region failed

理解错了,看原理,咱们的这次报错是可以重复执行的,在某些情况下,是不行的,具体可以参考:https://github.com/pingcap/br/blob/980627aa90e5d6f0349b423127e0221b4fa09ba0/docs/cn/2019-08-05-new-design-of-backup-restore.md 以及具体的 ingest sst 流程介绍:https://github.com/pingcap/br/blob/980627aa90e5d6f0349b423127e0221b4fa09ba0/docs/cn/2019-09-17-design-of-reorganize-importSST-to-TiKV.md

咱们的报错 是在 split region ,还没到 ingest sst 阶段

我看日志中, 在报错之前有这些日志


不是代表着有些文件已经import 了吗?

还有如果有ddl的话, 肯定不是幂等的, 看日志是没有ddl, 我又查了上游的admin show ddl jobs 这个这个增备也没有

看流程是不会有问题的,我再确认一下吧

好的, 多谢~~

可以重复执行

好的,, 我执行一下compaction 然后再重试一下

compact-cluster 之后, 重试还是一样的错误
Error: split region failed: err=message:"Coprocessor [components/raftstore/src/coprocessor/split_observer.rs:154]: no valid key found for split." : [BR:Restore:ErrRestoreSplitFailed]fail to split region

还有其它方法么 :joy:

tikv 日志的信息,多发一些吧,会有 region id 及。key 相关的信息的

tikv.log (9.3 MB)

日志在这里

咱们 compact 的时候,正常嘛,我看就是那个问题啊:[2022/06/10 15:27:59.834 +08:00] [WARN] [split_observer.rs:86] [“invalid key, skip”] [err="“key 7480000000000000FF365F72FFFFFFFFFFFFFFFFFF0000000000FA should be in (7480000000000000FF365F72FFFFFFFFFFFFFFFFFF0000000000FA, )”"] [index=0] [region_id=1781027]

正常。

确实是同一个问题,目测compact 没啥用

上面的 cf 都是 default 的,有 write 的嘛(上面有参考命令,制定了 write cf ,想确认一下你的 有没有)

我只compact default 列,你的意思是 write/lock 列都执行一下么

主要是 write 列(lock 不用)

可以参考这个命令

待会是只compact write 列, 还是把 default, write 列 一起都重新compact 一下?

只compact。write 列就行