tidb组件大量报错:write: connection reset by peer

为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:
【 TiDB 使用环境】
【概述】tidb组件出现大量write: connection reset by peer报错
【背景】前端是一台负载均衡,后端两台TIDB机器
【现象】发现tidb日志目录较大,有10G+,打开tidb-日期.log查询有大量报错,详细报错如下
【业务影响】暂未发现业务影响
【TiDB 版本】 v5.2.0
【附件】
[2022/02/19 15:28:31.245 +08:00] [ERROR] [terror.go:307] [“encountered error”] [error=“write tcp 10.1.2.11:4000->100.125.80.201:25825: write: connection reset by peer”] [stack=“github.com/pingcap/tidb/parser/terror.Log\ \t/home/jenkins/
agent/workspace/optimization-build-tidb-linux-amd/go/src/github.com/pingcap/tidb/parser/terror/terror.go:307\ngithub.com/pingcap/tidb/server.(*Server).onConn\ \t/home/jenkins/agent/workspace/optimization-build-tidb-linux-amd/go/src/gith
ub.com/pingcap/tidb/server/server.go:519”]
[2022/02/19 15:28:31.363 +08:00] [ERROR] [terror.go:307] [“encountered error”] [error=“write tcp 10.1.2.11:4000->100.125.68.201:24015: write: connection reset by peer”] [stack=“github.com/pingcap/tidb/parser/terror.Log\ \t/home/jenkins/
agent/workspace/optimization-build-tidb-linux-amd/go/src/github.com/pingcap/tidb/parser/terror/terror.go:307\ngithub.com/pingcap/tidb/server.(*Server).onConn\ \t/home/jenkins/agent/workspace/optimization-build-tidb-linux-amd/go/src/gith
ub.com/pingcap/tidb/server/server.go:519”]

5.2.0 有 BUG
先升级~

1 个赞

已升级V5.4.0,我怀疑和SLB的健康检查配置有关,健康检查配置是检查TIPD的40000端口。

1)lvs是用的哪种?云厂商的还是自己配置的?特别是超时时间之类 路由规则之类的是如何配置的
2)vip server和realserver之间的网络情况如何? 可以抓下包看看。

1 个赞

升级之后还有这个现象吗?

华为云提供的SLB,在华为云平台上叫ELB。关闭端口的健康检查就没这个报错了

只能关闭健康检查这一种方法吗,官方有没有修复计划