Prometheus的监控指标中有没有内存、CPU的limit

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】:V4.0.8
  • 【问题描述】:k8s环境中部署的TiDB的grafana有没有内存、cpu的limit值。
    场景: 1个集群是8核32G,一个集群是16核64G,我想设置个统一的80%资源利用率的时候报警。但是如果没有limt值,报警值是640% 和 1280% 体验不太好。

请问PingCap的同学或社区其他大神们,有没有指标可以轻松计算出cpu、内存使用的百分比,最大值是100%的那种。

报警值可以根据实际转换处理下就可以,比如可以告警是 640%,那么根据实际核数换算下就是 80%,那么告警的时候用 80% 就可以。

手工运维可以这样搞,全自动的设置报警指标不好弄。

每个人需求可能不一样,您从告警方面考虑都80%比较好,但是从查看问题等角度,这种实际cpu占用的显示可能更合理。所以,有需要的感觉还是您手工修改下配置比较好,多谢。

好的,谢谢。

:handshake: