Tidb替换Starrocks-降本增效

Tidb替换Starrocks-降本增效

1、 场景

业务综合宽表是报表生成、大屏幕展示和数据计算处理的核心数据结构。目前,这些宽表存储在Starrocks系统中,但该系统存在显著的性能瓶颈。例如,在高峰时段,查询性能(QPS)仅为20,99th百分位响应时间长达2.5分钟,且CPU和内存资源接近饱和。特别是在2024年,系统多次遭遇后端内存耗尽(OOM)的情况,导致需要手动干预才能恢复正常运行。鉴于Starrocks系统的版本较旧,我们正在考虑对其进行升级或者迁移到Tidb集群中。

为了评估升级Starrocks系统或迁移到TiDB集群的可行性,我们对同一环境下的TiDB集群进行了压力测试。测试结果表明,TiDB集群的性能表现超出了我们的预期,因此我们决定将业务综合宽表迁移到TiDB集群。

2、 宽表信息
image

3、 集群配置

  Starrocks 版本2.3.0 a9bdb09

 Tidb 版本 8.0.11-TiDB-v8.1.0

4、 Sql查询对比


5、Jmeter压测对比

压测准备:windows11 16核32G 安装jmeter

教程:Jmeter保姆级安装教程(超详细建议收藏加关注)_jmeter安装详细教程-CSDN博客

SQL语句准备:研发提供的复杂sql查询
image

线程配置:线程数200 ramp-up时间 10,持续300s;10秒钟拉起200个进程,持续300s

Tidb和Starrocks服务器CPU情况:


TidbServer和TiKV cpu压测消耗


Starrocks三台服务器cpu压测消耗
6、结果

根据测试结果分析,Tidb在压力测试期间,除TidbServer的CPU使用率较高外,TiKV和TiFlash的表现均符合预期。然而,Starrocks的三台服务器CPU使用率过高,且吞吐量指标未能达到理想状态。

7、后续规划

鉴于Starrocks系统的性能瓶颈和资源饱和问题,以及TiDB集群在压力测试中表现出的优越性能,我们决定将业务综合宽表从Starrocks迁移到TiDB集群,并将Starrocks资源陆续释放,实现降本增效

3 个赞

可以写个文章,比发帖子积分高多了。 :100:

Starrocks的版本是2.3,确实低了点。

好,马上转文章

1 个赞

文章好了发个链接啊

1 个赞

:upside_down_face: 可能是业务场景不适配,理论上sr在AP领域的性能要远远高于tiflash;
P.S:如果是有高并发点查需求,可以试试doris/selectdb,有行存

2 个赞

是的,这几个查询在tidb中走的都是tikv 基本上没有用到tiflash,所以并发能上去,我强制走 tiflash并发也不高。说明tikv的查询性能好。

1 个赞

专栏 - TiDB替换Starrocks:业务综合宽表迁移的性能评估与降本增效决策 | TiDB 社区 已发文章

赞!专栏上面也同步发了。

1 个赞

已经审核完成。

1 个赞

好强大。。

这说明你们的需求一开始就不适合starrocks,starrocks最低延迟也比较高。数据量大的统计类型查询,tiflash无论是性能还是稳定性都还比sr差得远(如果不慎走了tikv会直接炸掉要重启…)

2 个赞

有了这次踏空,才选了 tidb,来填坑,, :yum:

完全是不同的场景需求,一个是 纯 OLAP,一个是 HTAP
这样会多一个案例,给更多人参考了

1 个赞

非常对

此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。