再已经有tidb集群的情况下如何部署tispark

【 TiDB 使用环境】生产\测试环境\ POC
测试环境
【 TiDB 版本】
5.4
【遇到的问题】
目前已经搭建了tidb集群,但是没有tispark,想在不重建集群的情况下加入tispark(与tikv混合部署)如何操作,是直接修改配置文件,重新reload集群么?
【复现路径】做过哪些操作出现的问题
【问题现象及影响】

1 个赞

Tispark 主要是访问 PD 端口完成请求,所以配置好 Tispark 配置就可以直接启用。不需要重启集群。

1 个赞

目前是没有多余的机子,我想和tikv混合部署(在配置文件中添加tispark的信息),也是直接加了就可以么?

1 个赞

可以加,但是这个和 TiKV 混合部署要注意资源使用,尤其是 内存 和 CPU ,这块资源竞争比较严重的。

1 个赞

spark 需要单独的资源吧,, 放 Tikv 一起不太合适

如果是物理机,虚拟化以后在折腾会比较好
要不然就要 numa ,cGroup,会比较难搞

2 个赞

再次确认下直接加就可以了,也不要relaodtikv是吧:joy:,没弄过比较慌。

1 个赞

是物理机,只是测试下。我们这边有大量的etl,试试tispark,如果可以估计是重新弄机器部署spark。

1 个赞

tispark 和 tikv 没直接关系,直接撸,
拆分下端口和目录,避免冲突

1 个赞

好的,谢谢。

1 个赞

扩容的方式安装TiSpark

可以参考这篇文章

1 个赞

谢谢,按照这个已经弄好了,但是还有个问题,我启动sparksql的时候一直显示这个是有问题的么

1 个赞

@数据小黑 帮忙看看

1 个赞

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。