集群状态很不稳定

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】
【复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】
集群安装后使用tiup cluster display tidb-cluster的时候会《经常》出现pd的status变为Down,tikv的Status变为N/A,你们的会这样吗,怎么解决呢?不仅仅是状态这样显示,集群的连接确实也很不稳定。



请给出相应的硬件配置和网络配置信息,

:flushed:这已经不是不稳定了。服务器资源使用怎么样?

1 个赞

网络有问题吗?

资源我觉得还好,因为我刚安装完,也没运行啥任务,所以哪方面占用都不高

看这个报错感觉是网络有问题。

3节点混合部署,每个节点是16核,64G,500G硬盘,每个服务器都有kv,pd,db,网络是内网,下行90Mb/s,上行75Mb/s

心跳都发送失败了,是不是三个服务器之间网络有拦截啊?

哪种方式部署的哇

带宽不行吧,实际实例宕机了吗

没有 都是内网的ping和telnet的没问题

宕了,过一会儿状态就又好了

3节点混合部署,用的tiup离线部署的

你这网速不够啊,正常要求万兆,测试凑合千兆也行,你这个百兆不行

下载网速能达到近百应该算千兆的宽带吧

带宽被打满后,容易出现组件之间的失联,超过最大的心跳时间之后,重试多次还是失败,就会出现你上传的图中的状态

换个环境测吧,这个资源不够…

看看网络是不是稳定,丢包不;

检查下 grafana PD – etcd 下面的几个监控指标

网络不稳定吧

检查 网络,特别也要检查所有节点之间时间是否同步