emr spark连接 TiDB Cloud 的 instance 报错

【 TiDB 使用环境】/测试/ Poc
【 TiDB 版本】6.6.0
【复现路径】做过哪些操作出现的问题
aws emr spark 连接 TiDB Cloud 的 instance,按照https://docs.pingcap.com/tidb/stable/tispark-overview提示操作。
spark.sql.extensions org.apache.spark.sql.TiExtensions
spark.tispark.pd.addresses ${your_pd_adress}
spark.sql.catalog.tidb_catalog org.apache.spark.sql.catalyst.catalog.TiCatalog
spark.sql.catalog.tidb_catalog.pd.addresses ${your_pd_adress}
spark-shell --jars tispark-assembly-{version}.jar
【遇到的问题:问题现象及影响】
报PDClient: failed to get member from pd server
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面


【附件:截图/日志/监控】

mysql -h{host} -P{port} -u{username} -p{password} 也无法登录吗 ?
看报错像是 serverless 集群异常了

我自己创建了一个 新加坡区域的 serverless 试了下 现在是可以连接的
重试下看看呢?

1 个赞

tispark :face_with_open_eyes_and_hand_over_mouth: serverless 应该可能不支持作为 spark 的后端

我是用 spark 连的。是不是 tispark 的 serverless 不支持 spark?

:thinking:是mysql客户端连接正常么?

请查看一下spark 提交作业的集群机器,去访问tipd集群的网络是否正常

在 emr 集群上的 node 上通过 mysql 是可以连接到 TiDB Cloud 的 instance 的。

但是 emr 集群上的 spark shell,加载了需要的参数之后是报了PDClient: failed to get member from pd server的错误。

我看 TiDB Cloud 的 instance 给出的连接信息上是没有写 PD 相关的信息的。是不是说 TiDB CLoud 的 instance 的 PD 是没有对外暴露的?

是的,serverless 只会暴露 tidb 的链接地址,所以应该是不支持使用 tispark 的

这是连接PD通不过

tispark 依赖pd的,tidb cloud的话好像无法获取到pd的地址

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。