TIDB v5.0.0-rc漏扫修复修改server-version,reload部分节点报错

【 TiDB 使用环境】测试
【 TiDB 版本】5.0.0-rc
【复现路径】edit-config修改server-version版本,然后reload部分节点报错
【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】



过去 df -h 看下 是不是盘满了

三个Error的节点的磁盘都没有满



你确定只改了sever-version?这个应该只需要reload tidb-server啊,tikv和pd都不受影响啊?
tiup cluster edit-config 集群名 把你的整个系统配置文件发下看看

1 个赞

日志里面就是 :1. tiup 在本地生产 /tmp tidb.toml 配置文件 2. scp 过去。你现在是 scp 没成功。一般是要么盘不够生成不了或者是目标盘不够接受不了要么网络不同

SCP不过去 是不是没有配置每个节点ssh互信

我操作前没有确认集群状态,我怀疑集群可能是有问题的










配置文件我拿不出来,只能拍照了,server-version我又改回去了

87是你的中控机?你在87上ssh 下87、90、91试试,看着88/89/92是没问题的

可以ssh过去,节点应该很早就挂了,90的tikv.log是很早之前的了

那就是你87、90、91这三个节点上的配置文件早就不一样了,进程都没了?所以和现在的配置文件比对出问题了?

看样子是,这个怎么修复呀,因为这个不是我弄的,所以具体情况不清楚,我看display中显示的datadir的目录在节点上都没有,节点有/nvmedata1和/nvmedata2,并没有/ssddata1

先tiup cluster meta backup 备份一下当前集群的配置,然后通过tiup cluster edit-config 将你确定已经不存在的节点信息(例如87/90/91)删除之后,重新启动下集群

好的,谢谢

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。