多集群promethus的部署方案

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】
【复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】多集群promethus的部署方案。怎么做到节点的自动扩缩容
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】

:flushed:自动扩容?都是手工扩容吧

我的意思是:比如我有5个集群, 都需要进行监控。我想使用一套promethus 。怎么自动实现节点在扩容或缩容的时候,promethus能够监控到,自动添加和删除监控的节点

各个集群有自己的promethus,汇总到一个好操作点。整体用一个,每次扩缩容配置文件就重新生成,其它集群的信息就没了

也就是说最好,每个集群有自己的promethus 。 5套集群就会出现5个才能满足 自动监控新增节点,自动下架缩容节点的能力。

最好不要,不然就要你手动处理了
每个集群各一个普罗米修斯应该比较好

是的 ,我发现这个问题了。 那么 alert 告警也是5个吗 ?? grafana 也是5个吗?

4 个赞

分开看不是更清楚么,几套集成在一套granafa中很难区分各个节点的问题。

这些监控节点也不怎么耗费资源,大不了改改端口全放一个机器上就好

不然要是某个集群大批量的监控信息上报导致其他集群的监控失效不更麻烦了

我还是分开部署吧。遇到上面的问题了,也测试了。和你们说的遇见的情况一样

为啥要集中在一起看?那样应该更不方便吧

可以使用confd动态生成prometheus的配置文件

一个tidb一个Prometheus,确实比较浪费资源

这个是最佳的

对的比较浪费资源,但是 运维方便

学到了,感谢分享

资源和方便程度成正比

看一下prometheus的联邦集群,可以满足你的需求。联邦集群 | prometheus-book

每套里面单独监控比较合适