schedule.tolerant-size-ratio参数配置说明模糊

两地三中心部署方案文档中,提到了关于 schedule.tolerant-size-ratio 参数的优化调整说明

该参数是支持动态参数调整的,但是文档中并没有说明这个参数是需要在所有IDC的所有PD配置中修改,还是只修改 Leader 所在的 PD 实例的配置(拓扑规划中,已经将 Leader 限制在了其中一个 IDC内了),有没有可以详细说明该参数场景和调整后的实际影响程度的

  • 目前 PD 的配置可以动态修改的部分,只会在第一次启动的时候读取并记录到 ETCD ,后续只会使用 ETCD 内的配置。
  • 调整这个参数的目的是提高容忍度,达到减少跨机房调度的目的。文档中只是一个参考值,具体应该以实际的集群情况调整。
1 个赞

那这个支持容忍度的配置也支持在线配置,是会重新更新etcd的配置吗?不是特别理解这个更新机制

文档描述的场景应该是已有系统的参数调整,即已上线系统的参数配置

如果该参数不支持动态配置,那么文档描述是否有误,另外就是,如果是只支持初始化配置这个参数,在跨地域IDC部署和运维的时候就会有限制,生产环境下这样的问题该如何解决

对的。后续如果通过 pd-ctl 更新这个这个的话就直接会修改 ETCD 里面的信息,包括后续重启也不会读取配置文件里面这个配置项的信息,是直接去 ETCD 读取。

那如我上面这个截图,是需要修改所有IDC的PD配置吗?测试环境杭州节点的权重更高,而且leader都限制在杭州的IDC

如果不是初次启动的集群。只需要通过 pd-ctl 进行配置即可。

多谢耐心解答,这个问题基本上搞清除了,可以结题

请问下1. 看描述这个参数就是一个指定倍数的数值,为什么解释称为balacne 缓冲区大小,这个缓冲区怎么理解? 2. 在2地3中心这种架构中这个容忍的差距指定的同城的2个机房到异地城市机房的最大容忍度,还是整体的所有store间的容忍度,描述里指的是2个store,当位于同一机房时出现这种差距是不是会导致很不均衡?

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。