执行tiup reload --force后tikv无法启动

hotfix 版本链接:
链接:https://pan.baidu.com/s/16wtdAjl8dnNcY_mM0sj7EA
提取码:dgfd

麻烦下载 hotfix 文件,解压替换故障节点的 tikv-server 二进制文件,然后重新启动 TiKV 进程。

感谢!异常节点tikv已正常启动了

客气了,如果有新的问题欢迎开贴提问。
另外建议集群还是设置为 3 副本,设置为单副本没有数据高可用,出了问题可能比较难修复。

生产环境有配置3副本,因这个是测试环境资源有限就配了单副本,接下来会申请资源调整

嗯嗯,好的

注意到你开启了 level_merge,这个问题应该是 level_merge 和 background gc 冲突造成的。需要你关闭下 background gc 防止其他节点也出现类似现象。

[rocksdb.titan]
disable-gc = true

好的,我调整下配置

好的,有问题再反馈,多谢。

顺便问下,你们是什么时候开启的 level_merge,开启后效果如何?

v4.0.4版本时开启的,从监控图上看响应时间曲线比之前平滑很多

:+1::+1::+1:

再提供下地址,我也遇到类似问题;连接已经失效了,谢谢。

麻烦确认一下:

  1. 同样是 v4.0.6 的集群版本吗?
  2. 集群是开启了 titan 么?
  3. 集群副本数设置的是 3 副本还是单副本?
  4. 故障的 TiKV 节点有几个?对应的配置 tikv.toml 文件方便发一下么?

这个错误是在启动的时候有一项检查没通过,限制了不让启动,当时的 hotfix 是绕过了这个检查,后续还么有查到问题的根本原因,如果方便的话,可以提供一下上面的信息,我们继续排查一下。

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。