pd 2379 grpc 访问超时(tikv启动时),http访问成功

为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:
【问题描述】
使用的是tikv-operator在k3s上部署


若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

看的不是很明白,请问目前具体什么问题? 无法启动,还是什么? 麻烦具体描述下,截个图,上传下报错日志,多谢。

[2021/06/03 02:51:06.818 +00:00] [INFO] [util.rs:398] [“connecting to PD endpoint”] [endpoints=http://xxx-tikv-pd:2379]
[2021/06/03 02:51:08.820 +00:00] [INFO] [util.rs:358] [“PD failed to respond”] [err=“Grpc(RpcFailure(RpcStatus { status: 4-DEADLINE_EXCEEDED, details: Some(“Deadline Exceeded”)
}))”] [endpoints=http://xxx-tikv-pd:2379]
[2021/06/03 02:51:08.820 +00:00] [WARN] [client.rs:56] [“validate PD endpoints failed”] [err=“Other(”[components/pd_client/src/util.rs:389]: PD cluster failed to respond")"]

启动的时候这个获取 members 的 grpc 调用失败了
但是我在 tikv 的 containers 中通过访问 http://xxx-tikv-pd:2379/api/v1/members 能得到正确的信息

  1. 是离线环境部署吗? tikv 请求 pd 时使用域名访问的吗?请求域名是向 coredns 请求,coredns 解析出结果了吗?
  2. 如果没有解析出结果,将 coredns 非集群域名的 dns 请求,转发给公网 DNS 服务器的配置删除试试。(提前配分好,确认只有 tidb 集群服务。)
1 个赞

已经找到原因了,忘记关闭问题了。感谢回复。

请问您遇到的是上面的问题吗?麻烦帮忙确认下,感谢。

  1. 是离线部署;是通过域名访问;coredns 有部分 domain 解析出来结果了,但是有一个超时了
  2. 非公网环境下,是 coredns forward /etc/resolve.conf 到一个非内网的 nameserver

感谢回复

遇到同样的问题,请问怎么解决的呢?

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。