pd的leader切换之后,region就持续缺失,这种现象如何解决?

tidb版本:4.0.5
1.通过health显示3个pd都正常,但是在监控的instance中pd的IP地址时只有一个pd节点的IP
2.region在持续miss

  1. PD 监控 instance 中只有一个 pd 节点是预期的,PD 的监控中 instance 只会显示当前 PD leader 的节点以及曾经是 PD leader 的节点
  2. 关于 region miss 这个理论上是不会影响集群正常使用的,PD 检测到 region 缺失副本的话,会自动进行补副本操作,3 副本缺失 1 副本,raft 还是可以正常工作的,不会影响集群使用。目前集群使用正常吗?如果正常的话,可以再观察一下 miss-peer 的 region 数量后续是否会下降

现在使用正常,由于存储已经达到集群的上线,将副本数已经设置为2了,这个会对集群影响大吗?

副本数设置为 2 的话,没有高可用的作用了,当一个 tikv 宕机的时候,会导致部分 region 不可用,无法正常提供服务。

通过监控看集群的空间容量应该是 8.65T ,目前使用了 2.9T ,这个存储已经达到上限了么

总存储实际是6.5T左右,8.6T是由于tiflash和tikv同时用一台机器造成的,这个是副本数设置为2后开始由原来的5T下降到3.5T左右的,由于副本数不断缺失,这个存储在逐渐降低

麻烦反馈一下以下信息:

  1. pd-ctl 执行 config show 命令的结果
  2. pd-ctl 中执行 region --jq=".regions[] | {id: .id, peer_stores: [.peers[].store_id] | select(length != 2)}" 的结果,这个是查看集群当前 region 副本数不为 2 的所有 region。这个命令需要系统上有安装 jq 命令,如果没有安装会执行失败。



region比较多没有截全

这个如何对缺少副本的region进行强制添加副本呢?

请问下 设置 max-replica=2 / 设置 enable-palcement-rules / 添加 TiFlash 节点,这三个操作的顺序是怎么样的

正常开启 Placement rule 之后,原先的 max-replica 和 location labels 的参数就不生效了。

https://docs.pingcap.com/zh/tidb/stable/configure-placement-rules#开启-placement-rules-特性

可以反馈下 pd-ctl 执行 config placement-rules show 的结果看下

先设置max-replica=2 一段时间后再设置 enable-palcement-rules 再添加TiFlash

如果安装了一个节点的tiflash不能将enable-placement-rules设置为true吗?这个如何解?

https://docs.pingcap.com/zh/tidb/stable/configure-placement-rules#使用-pd-ctl-设置规则

可以参照文档修改 placement rule 的 count 值,建议设置为奇数,设置为偶数的话,没有高可用的意义,设置为 2 的时候,没有高可用的作用了,当一个 tikv 宕机的时候,会导致部分 region 不可用,无法正常提供服务。

添加 TiFlash 节点需要设置 enable-placement-rules = true 的

好的, 还有个问题想咨询下,tiflash的节点个数和副本的个数有什么关系?

这个副本是指 TiFlash 副本数么,如果是 TiFlash 设置的副本数的话,设置的副本数需要小于等于 TiFlash 节点数量,如果只有 1 个 TiFlash 节点,但是设置了 TiFlash 副本数为 2 ,那么最多只能存放一个 TiFlash 副本。

在placement-rules的配置中
1.group_id:pd的副本数对应tikv集群的副本数
2.group_id:tiflash的副本数只是对应表(tiflash)级别的吧
以上理解对不
image

是的,可以这么理解

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。