PD的hot-scheduler基于读流量或写流量进行调度,会导致调度冲突吗?

阅读PD源码中产生的疑惑,PD的hot-scheduler会随机根据 当前集群的读流量 或 写流量进行热点均衡;从代码中看起来,在产生operator的过程中,仅考虑读或者写一种 信息,这样的调度生成方式是否会导致出现冗余的调度,region反复迁移,无法达到平衡态?

如果存在上述问题,是否可以将图中的两个参数调大,提高调度的门槛来解决上述问题?

PD 的 Hot Region Scheduler 基于读流量或写流量进行调度,不会导致调度冲突。Hot Region Scheduler 会根据当前集群的读流量或写流量来判断哪些 Region 是热点 Region,然后根据热点 Region 的分布情况来生成调度任务。在生成调度任务时,Hot Region Scheduler 会同时考虑读和写两种信息,以便更好地均衡热点 Region。

在产生 operator 的过程中,Hot Region Scheduler 会同时考虑读和写两种信息,以便更好地均衡热点 Region。Hot Region Scheduler 会根据当前集群的读流量和写流量来计算每个 Region 的热度值,然后根据热度值来判断哪些 Region 是热点 Region。在生成调度任务时,Hot Region Scheduler 会根据热点 Region 的分布情况来生成调度任务,以便更好地均衡热点 Region。

如果存在冗余的调度、Region 反复迁移等问题,可以考虑调整 Hot Region Scheduler 的参数来解决。例如,可以将 hot-region-schedule-limithot-region-cache-hits-threshold 参数调大,提高调度的门槛,以减少不必要的调度任务。同时,也可以根据实际情况调整其他参数,例如 leader-schedule-limitregion-schedule-limit 等,以更好地适应当前集群的负载情况。

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。