控制能力不足:从测试来看,控制TP业务还可以,但是控制略带有AP查询(如排序,聚合等)的业务能力不足(不容易控制住),往往都是这种带有AP类的查询才导致的故障,如何理解资源管控 (Resource Control) 中的RU
RU概念难以理解:线上运行后再根据运行调整RU,这个调整的归属很难把控,到底是运维层面的DBA调整还是开发人员调整?DBA不懂业务,容易出故障(比如遇到月批、秒杀日等资源占用会突增,控制了资源导致业务受影响,但是DBA不熟悉业务),开发人员不熟悉RU的概念基本也是放到最大来调整。
限流策略落地难:参考这里:Runaway Queries在故障处理情况下存在的问题
更倾向于cgroup类的隔离方式。