集群状态正常,但是pd dashboard获取节点信息失败

【TiDB 使用环境】 Poc
【TiDB 版本】v6.5.3
【部署方式】物理机部署
【集群数据量】1
【集群节点数】5

集群整体状态是正常的,但是pd dashboard里面显示一个节点异常

去那台服务器上看下监控启动了吗?

什么监控

tidb-deploy/monitored-9100/bin 下面有个node_exporter 这个进程启动了吗?

启动了,这个node_exporter 是给prometheus grafana使用的,不是pd dashboard吧

1 个赞

请问这个问题解决了吗,遇到了同样的问题,查找了很一会,还是没有解决,这个节点单单挂的cdc,似乎对单独挂载的CDC是没法查看这个磁盘的吗,我这儿cpu和内存倒是可以正常显示。

没解决

1 个赞

这个不好排查啊

*监控数据采集链路中断

node_exporter 是采集操作系统的CPU、MEM、Disk和Network的

应该是启动了~~

java进程异常

应该启动成功了

可能通讯环节异常

实践是检验真理的唯一标准

在矛盾中解决问题

发现问题,验证问题

可能是该节点的某个组件(TiDB/TiKV/TiFlash/PD)实例状态异常(如未注册、心跳失联、资源超限) ,但未触发集群高可用阈值(比如 TiKV 副本数仍满足 3 副本、PD 集群多数派存活),所以整体业务不受影响

状态都是正常的。

防火墙没关吧