【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】
【复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
【资源配置】
【附件:截图/日志/监控】
查看监控,发现最近30天凌晨2点磁盘空间使用率有为0 的时候 查看tikv 节点状态没有发生重启,查看tikv日志没有发现错误日志,查看系统日志发现:
感觉这个情况应该是没有采集到数据所以显示为0吧?大佬们有没有遇到这种情况
【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】
【复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
【资源配置】
【附件:截图/日志/监控】
connection refused 应该就是没连上,没获取到数据
显示为0,并不是真的为0,有可能就是没采集到数据,你还有其它监控吗?可以双向对比下
其他的监控项正常,但是很奇怪基本是每天的凌晨2点会有采集不到的问题,不知道这个应该去哪里开始排查。看了普罗米修斯没有明显报错
是的,看tikv 节点正常,没有发生重启,不知道问题出现在哪里,该从哪里排查
排查下2点是不是有定时任务?比如备份、收集统计信息或者其他业务上的?
dashboard这个时间段的慢sql看看?
查看了下 定时任务是有个备份的,凌晨00:00开始基本到00:30结束,统计信息是每天的00:00—06:00 ,其他的未发现有啥异常的
看一下机器有没有什么异常,比如网络抖动 或者什么其他的问题,导致那会儿机器无法响应,导致exporter采集不到数据