tikv 启动异常

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】
tikv 启动不了了,直接报错。
【附件:截图/日志/监控】

00] [FATAL] [server.rs:428] [“panic_mark_file /home/tidb/tidb-data/tikv-20160/panic_mark_file exists, there must be something wrong with the db. Do not remove the panic_mark_file and force the TiKV node to restart. Please contact TiKV maintainers to investigate the issue. If needed, use scale in and scale out to replace the TiKV node. https://docs.pingcap.com/tidb/stable/scale-tidb-using-tiup”]

你部署了 几个 tikv? ?

请勿删除 panic_mark_file 并强制重启 TiKV 节点。如有需要,请使用 scale in 和 scale out 替换 TiKV 节点。
你是不是删除了什么?

参考这个。

3个节点

最先是自己挂了,然后就启动不了了,什么都没有删除

这个文档也没解决问题哇,我直接把那个文件删了,重启起了来了,我看到那个文件都是一个空文件,什么都没有

https://github.com/tikv/tikv/blob/503648f18312b8978f19b17f4e58b3f011bb3cb0/components/tikv_util/src/lib.rs#L536

看上去在创建这个文件前,还会输出一个critical级别的日志,那个里面记录不得不异常退出的原因,然后会设置一个原子的布尔值,发现这个布尔值为true就会创建这个panic_mark_file文件。

如果你知道上次为啥退出有一定的把握,这么操作到不是不行。不过这毕竟不是推荐的做法,推荐的做法就是缩容掉这个tikv再扩容一个。能弄清楚异常退出的原因最好。

可以mv到其它地方试一试,没有其它提示