1、pd的几个balance-schedule 调度速度后几个*schedule-limit参数影响,以下是上述限制生效的逻辑不知道是否准确:
scheduler在达到每个interval后通过AllowSchedule和其他一些限制判断是否产生调度,而AllowSchedule是判断schedule的OperatorControllor中等待队列中operator的数量是否小于schedule-limit参数设置,如果小于则产生operator加入等待队列。schedule每次只产生一个operator。dispatcher不断的循环将operarter通过心跳发给leader。
2、如果dispatcher速度很慢或者operator操作本身很慢,会不会导致OperatorControllor中等待队列不断增长,消耗大量内存,是否队列长度有上限?
3、 6.0版主中对"balance-leader-scheduler"增加了batch项(默认4),一次shedule会产生4个operator。"leader-schedule-limit"的限制下即使batch是多个的情况下同样会限制整体operator产生速度?
4、" scheduler-max-waiting-operator
用于控制每个调度器同时存在的 operator 的个数 ", 这个参数指的是在哪里的operator个数,等待队列?