查看集群信息经常出现pd的status变为Down,tikv的Status变为N/A

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】
【复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】
使用tiup cluster display tidb-cluster的时候会《经常》出现pd的status变为Down,tikv的Status变为N/A,你们的会这样吗

没出现过这种情况

V6.5.0没出现过这个问题,出现异常的时候截下日志看看

正常来说不会这样,你看下是真的down了嘛,tiup cluster display tidb-cluster --uptime

1 个赞

测试集群都没出现过

没出现过,但 TiDB 出现过因OOM起不来的现象

我偶尔会出现,一会在执行就好了。实际上集群没问题,可能网络问题,就没有管过

不应该经常出现这个问题,是混合部署嘛?会不会是内存不够,频繁oom?

你这是有网络波动?

前几年刚开始用的时候出现过,现在没有出现过了。

tiup机器ping下各节点正常吗?

稳定,查下网络

TiDB是哪个版本?尽量选择稳定的LTS版本。网络的稳定性也需要检查一下。

ps -ef | grep tidb 看一下启动时间
具体什么版本

好几个测试集群,从来没见过这样的,你看是不是网络有问题

问一句,只是display显示状态异常,还是实际集群不可用?

没有遇到过, 之前遇到过 tidb实例 会定时重启。因为有多个,没有影响使用,升级到6.5后没再出现。

定时重启很准时吗

没出现过,你的问题是否存在规律性,还是一直这样?

这边用7.1版本,没出现过这个问题。