TIkv 节点不工作,无法启动

config set leader-schedule-limit 0 config set region-schedule-limit 0 config set replica-schedule-limit 0 config set merge-schedule-limit 0 config set hot-region-schedule-limit 0 现在我失败节点正在下线中 调整这个参数 是不是就会 停止调度任务 我现在怎么紧急恢复集群

你只有2副本,现在一个节点无法启动,所以选不出leader,可能无法完成delete store的操作,先恢复region. 别着急增删节点了.

先检查!=2的region信息 ./pd-ctl -u :<pd_client_port> -d region --jq=".regions[] | {id: .id, peer_stores: [.peers[].store_id] | select(length != 2)}"

可以在所有未发生掉电故障的实例上,对所有 Region 移除掉所有位于故障节点上的 Peer; 要求:在未发生掉电故障的机器上运行;TiKV 处于关闭状态 注意:如果是低版本可能没有 -s --all-regions参数 tikv-ctl --db /path/to/tikv-data/db unsafe-recover remove-fail-stores -s <s1,s2> --all-regions

       需要先关闭tikv:

cd /scripts ./stop_tikv.sh

再执行,你的store 5是offline,所以执行以下命令,先恢复store: tikv-ctl --db /data/db unsafe-recover remove-fail-stores -s 5 --all-regions 执行命令后已经恢复,后续请添加新节点,并且最好修改副本为3,多谢

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。