已经按照官方文档配置了还是提示:集群中未启动必要组件 `NgMonitoring`,部分功能将不可用。

【 TiDB 使用环境】生产环境
【 TiDB 版本】从5.3升级到6.5
【复现路径】在线升级tidb 集群
【遇到的问题:问题现象及影响】按照官方文档在线升级tidb集群,tiup,tiup cluster都是最新版本。升级到6.5之后dashboard还是提示:系统健康检查失败集群中未启动必要组件 NgMonitoring,部分功能将不可用。已经按照https://asktug.com/t/topic/693816这个帖子操作了,把/mysqldata/tidb-data/prometheus-8249这个目录下的数据都全部删除了,然后对prometheus节点进行了reload,但是还是提示不可用。
【资源配置】
【附件:截图/日志/监控】


https://docs.pingcap.com/zh/tidb-in-kubernetes/dev/access-dashboard#启用持续性能分析
按这个部署 TidbNGMonitoring CR试试看?

监控完全可以通过缩容,然后再扩容的方式重建的

对prometheus进行了缩容扩容 还是解决不了,还是提示 集群中未启动必要组件 NgMonitoring ,部分功能将不可用。

您好,这个对集群使用有影响吗?
如果 ngm 部署成功,进入 TiDB Dashboard 后右上角将不再提示系统健康检查失败: 集群中未启动必要组件 NgMonitoring,部分功能将不可用

如果升级到 6.5 版本后 TiDB dashboard 中的系统健康检查失败,可能是升级过程中 NgMonitoring 组件没有正常启动。

一种可能的解决方案是使用以下命令手动启动 NgMonitoring 组件:

tiup cluster start <cluster-name> --node <node-name> -R prometheus

将 替换为您的 TiDB 集群的名称,将 替换为运行 Prometheus 组件的节点的名称。 -R 标志指定要启动的组件。

如果这不能解决问题,您可以尝试以下步骤:

检查 Prometheus 组件的日志,看看是否有任何错误消息或警告可能表明问题的原因。 日志通常位于目录 /mysqldata/tidb-deploy/prometheus-8249/log/ 中。

检查 Prometheus 组件的配置以确保其配置正确并指向正确的数据源。 配置文件一般位于目录/mysqldata/tidb-deploy/prometheus-8249/conf/。

重启 Prometheus 组件,再次查看 TiDB dashboard 查看问题是否解决。

如果这些步骤都不能解决问题,您可以尝试向 TiDB 开support ticket以获得进一步的帮助。

如果是以tiup 1.12.0 版本升级集群的话,可以再次升级tiup版本到1.12.1,然后重启一下prometheus。
具体bug可以看看这个文章:
专栏 - 手把手教你成为 TiDB 的 Contributor | TiDB 社区