tikv节点的机器异常,准备通过扩缩容的方式下线这个节点,怎么操作

双实例部署的tikv节点,服务器异常,停止了上面的tikv进程。
后续准备通过先扩容,然后再缩容的方式下线改异常的服务器,
请问有什么需要注意的么
集群状态如下图

1.按照官方文档对 Tikv 进行扩容。
2.扩容后需要 reload 下 集群。一遍 prometheus 可以将对应 Job 加入到 其配置文件中。
ps. reload操作会滚动的对集群各各实例进行 重启 操作。如果不希望重启可以在 reload 集群时 添加 skip restart 参数跳过实例重启
3.如跳过了重启操作,请手动重启 下 prometheus 实例服务
4.通过 pd-ctl 确认集群中的 region 数量是否 等于 3,如有缺少副本的 region 建议等待。
5.等待系统稳定后,使用 scale-in 命令缩容操作 ,如果操作异常可以添加 --force 强制缩容。

3.如跳过了重启操作,请手动重启 下 prometheus 实例服务
– 请问这个是不是通过如下命令操作
tiup cluster start ${cluster-name} -N 10.x.x.x:9090

4.通过 pd-ctl 确认集群中的 region 数量是否 等于 3,如有缺少副本的 region 建议等待。
另外这个具体怎么操作,没有查到对应的命令,能否告知一下,谢谢

3.tiup cluster start ${cluster-name} -R prometheus
4.参考如下
https://docs.pingcap.com/zh/tidb/stable/pd-control#根据副本数过滤-region

[tidb@10-0-0-15 ~]$ tiup ctl pd -u http://10.0.0.72:2379 -i
Starting component ctl: /home/tidb/.tiup/components/ctl/v4.0.9/ctl pd -u http://10.0.0.72:2379 -i
» region --jq=".regions[] | {id: .id, peer_stores: [.peers[].store_id] | select(length != 3)}"
exec: “jq”: executable file not found in $PATH
» write |1: file already closed

执行pd-ctl的命令好像不太对。还是这个命令不能通过tiup的pdctl来执行?

知道了,要yum install jq
» region --jq=".regions[] | {id: .id, peer_stores: [.peers[].store_id] | select(length != 3)}"
{“id”:1831867,“peer_stores”:[1,270184,5,270183]}
{“id”:9462704,“peer_stores”:[270181,5,270182,27173163]}
{“id”:12675433,“peer_stores”:[270180,27173164,270182,8]}
这个看上去是这3个region的副本数是4个?。。。为什么会发生这种情况

在 region peer 迁移过程中 会先加 新的 peer 再删除老的 peer 。在部分时间窗口看会是出现 4 副本的情况。如果 超过 3 小时 一直是 4 副本,可以考虑通过 CTL 对其中多余的副本进行删除。