手动剔除一个高io有问题的pd节点,剔除成功之后,滚动升级命令,另外一个正常的pd节点报错

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】:v3.0.8
  • 【问题描述】:

因为其他两个pd节点的系统内核版本和这个高io的内核版本命令发现不一样 有问题的内核 3.10.0-957.1.3.el7.x86_64 没有问题的两台内核 3.10.0-1062.9.1.el7.x86_64 所以决定剔除有问题那台pd机器

之后就报错,之前正常的那个pd节点,下图报错的那个ip

请检查各个服务器时间是否一致

手动输入date检测时间是一致的 是这样的,我怀疑是剩下的pd没有leader问题导致,因为之前这个被我踢出去的有问题的高io节点是leader节点

一会儿有,一会儿没有

  1. 检查一下几个 pd 节点进程是否正常存在
  2. 检查一下pd节点有没有不断重启的情况
  3. 方便的话提供一下几个 pd 节点的日志文件

pd_newsql-3=http://172.31.3.44:2380,pd_newsql-4=http://172.31.8.222:2380,pd_newsql-5=http://172.31.10.85:2380,pd_newsql-31=http://172.31.13.114:2380\ 检查下这是当前3个PD的ip对吧? 分别测试以下telnet ip 2379 telnet ip 2380 互相通吗? 另外,感觉有时通,有时不通,你有没有ip冲突?

确认了是安全组端口没开

好的,多谢反馈