查看集群信息经常出现pd的status变为Down,tikv的Status变为N/A

这种绝大多数是网络不好导致的
看看 dashboard 有没有问题
查看下 log welcome 关键字上次重启什么时候

没有出现过该问题,可以查下节点的网络情况

是3节点混部,每个都有kv,tidb,pd

不准时,没有规律

感觉我这个和你说的现象比较一样

没规律,我刚部署完现在也没有什么qps,这种现象总是出现

Since都是23h,应该不是真down

好像对使用没影响,只是display显示状态异常

访问是否异常或者超时;通过硬件看下网络,IO等硬件情况;故障节点是否出现oom,看下内核日志dmesg -T

如果只是display的话,并且也不是有规律的,可能是网络问题

1 个赞

先从系统入手,从监控观察cpu是不是负载很高,系统内存是不是用完了,还有磁盘是不是延迟很大

啥环境部署的呢,虚拟机吗

我没遇到过,但是你这个肯定是不正常的

没出现过

正式环境,3节点混部,每个节点16核64G500G硬盘

怎么确定是不是网络问题呢

磁盘延迟怎么测呢

dmesg -T看了 近期没有日志,最早的都是2月23的

好像有影响 ,服务器很不稳定,总报kv或者pd挂了

这个怎么查ping?