【 TiDB 使用环境`】生产
【 TiDB 版本】 v3.0.3
【遇到的问题】 tikv监控丢失
【复现路径】
【问题现象及影响】
其中一台Tikv在Prometheus里的监控丢失,还有一台监控断点。
这个问题是否可以通过直接重启tikv来恢复?
问题要分开看
- tikv 节点的服务是否正常?
- tikv 节点 的 black box_ exporter 和 Node Exporter 服务是否正常?
若 tikv 的服务是正常的,tikv 服务重启了也没办法 让 exproter 启动的…
请参考~
不会是pd leader反复切换导致的吧
先检查下tikv,exporter的端口还在不在
等不到社区救援,我就直接重启了tikv实例
重启后看tikv的metrics接口已经正常了。
现在正在等待tikv的 Scheduler error 恢复正常。。。