集群多个sst文件损坏,是否可以排除这些错误sst文件让tikv正常启动

【 TiDB 使用环境】生产环境
【 TiDB 版本】5.4.0
【遇到的问题】集群有5个tikv节点,有三台tikv存在个位数sst文件损坏的情况,导致tikv无法启动。有没有办法能忽略掉这些错误或者丢弃部分数据,让tikv正常启动,
【复现路径】做过哪些操作出现的问题
【问题现象及影响】生产环境tikv无法正常启动,数据无法恢复


【附件】

请提供各个组件的 version 信息,如 cdc/tikv,可通过执行 cdc version/tikv-server --version 获取。

https://docs.pingcap.com/zh/tidb/stable/tikv-control#打印损坏的-sst-文件信息 参考bad sst处理试试

1 个赞

您好,因为没有提示处理办法,所以我尝试移除异常sst文件,但是会显示这个错误,还有其他命令或者方式可以让tikv先启动嘛

目前能找到的就这一种方式

尝试输出损坏的sst文件并清理

1 个赞

请问是几副本,如果五副本的话感觉可以用unsafe-recover尝试下,如果真的没有其他办法

官方的命令输出样例有问题,这里应该是 sst文件号,和文件名一样,参考我的测试

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。