TIDB集群不依赖grafana监控,是否还有其他的手段

【 TiDB 使用环境】生产环境
【 TiDB 版本】V6.5.8
【遇到的问题:问题现象及影响】 TIDB的grafana监控非常完善,这毋庸置疑,但是如果TIDB集群比较多的场景下,是否有其他的监控方式【最好是API接口】,这样可以统一收敛到一个监控平台上,目前从社区文档上看到(https://docs.pingcap.com/zh/tidb/stable/tidb-monitoring-api),但还是有些不全,特别是tidbserver 【连接数,QPS,每秒行变更,慢请求等等】,这块有大神深入调研过么?

grafana从Prometheus取的数据,你的监控也可以从这里抓取

1 个赞

通过 TiDB 监控 API,是全的。

目前grafana已经算是比较主流的监控观测组件了,如果想内嵌到自己的平台,可以调用grafana的图表,在grafana上建好图表,在自己的平台内嵌,这样也可以做到


是这里么?

是的,prometheus就是使用tidb各组件的metrics接口获取监控数据的

请教下prometheus是不是monitoring_servers安装的组建呢?

有接口,主流的监控系统都可以

tidb自身的监控已经覆盖很广了,特定需求可以自定义export采集

接口都有吧

是的呢

这个monitoring_servers部署也有可能是单点 :sweat_smile:

grafana 是一个监控面板,数据都是在 普罗米修斯中的
只要你的 监控平台支持 promsql 就行

就是一个单点,Grafana和alertmanager也是单点

你的平台可以直接对接到集群的prometheus中,或者自己去各个节点收集组件信息,推荐第一种

不知道prometheus是不是也调用的PD接口拿到这些基础监控数据的

抓prometheus简单,用API复杂

这块得研究下prometheus是从TIDB哪些节点抓取的数据,哈哈

可以的,你看下prometheus 配置文件中的地址,都是各组件状态端口的metrics下,你可以测试tidb的试下,curl http:tidb地址:10080/metrics试下,tidb地址换成你的tidb地址,可以理解为各组件已经实现了exporter了

刚才测试了下,TIDBServer的metrics接口是OK的,我在看看TIKV组件上是否也有接口,非常感谢