为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。
- 【TiDB 版本】:2.1.5
- 【问题描述】:部署了1tidb+3pd+3tikv,我用周末两天的时间大概插入了wm15亿数据,今天上午按照缩容pd的教程,把leader给删了(pd1,主要验证大数据量情况下leader自动切换问题),但是过了很久,使用pd-ctl都无法通过另外两个pd执行member命令,报错信息竟然是说pd1连接失败,按理说都已经下线关闭了不应该这样啊。然后我就执行滚动更新命令,报错说pd2无法get name,使用pd-ctl执行member,会处于阻塞状态,过了很久才提示:read tcp xxxx—>pd1:2379 read:read connection reset by peer 。最奇怪的是执行curl -v xxxx:2379/pd/api/v1/leader这个是有返回结果的,而且能够正常连接数据库,能够正常查数据。我现在也不清楚现在这个pd集群到底是什么情况,反正只要一滚动更新就会报错,不知道怎么让它恢复正常。啰嗦的话比较多,不知道问题说明白了没有。
若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。