TiDB存储百亿数据的集群规模要怎么配置

之前测试tidb的时候用了三台tikv,灌了1亿多的数据,每台tikv的ssd(200G)占据了20G左右,请问一下官方或者大佬们,如果我要存储百亿级的数据推荐的配置是什么样的呢?
集群现有配置如下:


因为在验证阶段,所以ssd都只申请了200G的空间。

请大佬们解答一下~拜托

2赞

我也期待大牛来解答这个问题,也是我关心的了

2赞

个人建议:
1、百亿的数据量也要根据单行的数据的大小来评估数据量,可以理解为关系型数据库中的字段多少来评估,10个字段和100个字段以及单列存储的大小都有关系, 单从百亿数据量来评估存储量,评估不准确
2、评估tidb 集群的配置分为两个方案,计算和存储,分别以来tidb 和tikv 存粗包括计算下推因子 同时还要评估查询sql的复杂度以及执行计划信息
3、数据量是一个循序渐进的增长过程,配置集群的时候做好磁盘扩容,以及集群扩容的准备

  1. 一个系统的硬件配置,最主要不是存储,而是计算。所以你得再提供QPS信息,峰值QPS能有多少?
  2. 仅有QPS别人顶多是给你个通用的配置方案,如果希望尽可能贴合生产,最好是能录一部分生产流量到测试集群,或者是让开发提供一些业务SQL,自己跑压测,测出来真实场景下峰值QPS需要多大的配置。
  3. 做到第二步,也只是把业务从其他数据库迁移到TiDB而已。TiDB是分布式架构,在最佳实践上,和单机的还是有很大不一样的。如果想做的更好,要根据第二步时候的压测数据,找到比较耗费性能或者业务延时变大的SQL,做从表结构、SQL、TiDB配置多方面对其进行优化。
2赞