pd添加了新节点后,剔除了老节点,集群状态正常,数据写入正常,但是发现通过tidb server添加索引报错,错误信息显示还是链接已剔除的pd节点

【 TiDB 使用环境】生产环境
【 TiDB 版本】v 7.1.3
【复现路径】tidb集群原有3个老pd节点,添加 3个pd新节点,剔除了原来3个老pd节点,集群状态正常,数据写入正常,但是发现通过tidb server添加索引报错,错误信息显示还是链接的已剔除的pd节点

CREATE INDEX licence_upload_log_code_IDX USING BTREE ON wac_heb_test.licence_upload_log (code);
【遇到的问题:问题现象及影响】数据写入正常,但是添加索引报错,错误信息显示还是链接的已剔除的老pd节点。

SQL 错误 [1105] [HY000]: pd address (192.168.212.32:2379,192.168.212.33:2379,192.168.212.37:2379) not available, error is Get “http://192.168.212.37:2379/pd/api/v1/config/cluster-version”: dial tcp 192.168.212.37:2379: connect: connection refused, please check network

补充:在新加pd节点后,先剔除老pd lead节点,pd leader节点自动转移到新pd后,才全部剔除的老pd节点
【资源配置】新的pd节点

【附件:截图/日志/监控】

日志搜下看看哪个组件报的错

使用工具加的索引报的错,从tidb server里边能看到相同的报错

重启一下

1 个赞

重启tidb server节点,还是整个集群?

tiup display看各组件状态会比dashboard更准确一些,比如有些组件scale in后可能是pending状态的,需要执行命令prune彻底清理掉。


状态都是正常的,已经稳定运行1周了,目前就发现加索引不行

重启tidb Server试试先

重启tidb server节点就行

1 个赞

tidb server应该没有重新识别到吧?重启tidb server了么?配置文件改了什么?

嗯,那重启一下看看吧

分析下最近一周的errer级别日志

重启tidb server角色可以了,感谢

重启能不能解决。

重启解决问题

重启tidb server节点试试

看来重启是万能膏药。

重启试试

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。