Prometheus的监控指标中有没有内存、CPU的limit

TiDBer_jYQINSnf · 2021 年1 月 19 日 13:43

为提高效率，提问时请提供以下信息，问题描述清晰可优先响应。

【TiDB 版本】：V4.0.8
【问题描述】：k8s环境中部署的TiDB的grafana有没有内存、cpu的limit值。
场景: 1个集群是8核32G，一个集群是16核64G,我想设置个统一的80%资源利用率的时候报警。但是如果没有limt值，报警值是640% 和 1280% 体验不太好。

请问PingCap的同学或社区其他大神们，有没有指标可以轻松计算出cpu、内存使用的百分比，最大值是100%的那种。

不懂就问 · 2021 年1 月 20 日 08:34

报警值可以根据实际转换处理下就可以，比如可以告警是 640%，那么根据实际核数换算下就是 80%，那么告警的时候用 80% 就可以。

TiDBer_jYQINSnf · 2021 年1 月 21 日 12:25

手工运维可以这样搞，全自动的设置报警指标不好弄。

yilong · 2021 年1 月 22 日 08:21

每个人需求可能不一样，您从告警方面考虑都80%比较好，但是从查看问题等角度，这种实际cpu占用的显示可能更合理。所以，有需要的感觉还是您手工修改下配置比较好，多谢。

TiDBer_jYQINSnf · 2021 年1 月 22 日 08:51

好的，谢谢。

yilong · 2021 年1 月 25 日 02:00