TiKV-v5.0.1 打开tls后,用go-ycsb来进行性能测试,遇到grpc链接的问题

为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:

【概述】场景+问题概述
TiKV-v5.0.1, docker单机部署, 3-tikv(开启tls), 1-pd,使用go-ycsb进行性能测试,遇到grpc链接问题:
go-ycsb在load步骤的输出:

INFO[0020] drop regions that on the store 1(188.72.0.113:20160) due to send request fail, err: rpc error: code = Unavailable desc = all SubConns are in TransientFailure, latest connection error: connection error: desc = “transport: authentication handshake failed: context deadline exceeded”

【背景】做过哪些操作
使用pd-ctl 查看集群状态,TiKV都还是Up的状态。
【现象】业务和数据库现象

【业务影响】

【TiDB 版本】
v5.0.1
【附件】

  1. TiUP Cluster Display 信息

  2. TiUP Cluster Edit Config 信息

  3. TiDB- Overview 监控

  • 对应模块日志(包含问题前后1小时日志)

若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

2 个赞

transport: authentication handshake failed

认证握手失败? 加了TLS 后,认证是否正常?

认证通信都正常,使用go-ycsb性能测试跑了20多个数据后就出现这个问题

日志描述的就是这个阿,你有更多更详细的描述么?

https://github.com/grpc/grpc-go/issues/2663
感觉是这个问题。另外,麻烦检查下 docker 的资源使用情况,是否内存,IO,CPU 等消耗太高。

个人感觉是资源使用的问题,因为前面性能测试的20多个数据都是正常的,但我目前尚不确定具体是哪些资源出现瓶颈。
另外,当不开启TLS进行性能测试,一切正常。

这明显是个TLS 的bug阿,可以把这个bug 提交到 BUG反馈区,会有人接收处理的,谢谢拉!:+1:

建议把你目前收集的信息在整合一下,在做反馈 :nerd_face:

这个是反馈地址: