这是一篇粗稿,大家帮忙看看能不能写,如果能写该怎么优化
用业财的思维做dba,tidb为啥比oceanbase费钱?不我们可以更省钱
oceanbase 在业务中老是以tidb 贵,tidb不好对tidb的业务进行攻击。
分久必合 合久必分
我们今天来探讨一下大数据业务的成本分析
最近公司需要上一批归档业务。
这些数据不能丢。要能查。要查得快 用的广。还要成本低。既要又要还要。这个问题难倒我了
大家都知道在云上机器费用可是很贵的。如果100万,在线下可以买机器用一辈子。在云上可能只能用一年
最近都在节能减排 我们之前用的是aws的rds 一年费用要几千万。
费用节省从几方面
1.存储
2.机器数量
3.单机价格
4.机器类型
4.机器架构
5.垮网络交换费用
6.薅资本主义的羊毛
7.pitr
1.存储 aws上的存储是计价的。ebs分磁盘费用和io费用。
2.机器数量。
我们不能因为tidb是分布式数据库就必须部署分布式业务。也要考虑单价问题。而且分布式有网络交换。性能也有损害。如果我们放在同一台机器内网络的损耗是节省了。
3.单机价格
你是买一批4核心的机器 还是买一台64核心的机器到底那个计算能力强?
4.机器架构
aws的机器分arm机器和x86机器 arm的价格大概在x86的70%左右。tidb支持arm机器。也是一笔不小的省钱费用。
5.垮网络有交换费用。
6.s3费用怎么最省钱.在云上如何用tidb薅羊毛。
s3 费用非常便宜。
而且aws的网络性能又非常好。我们可以花s3的钱做本地计算的事情。
平时归档
BACKUP TABLE `test`.`sbtest01` TO 'local:///mnt/backup/sbtest01/';
要算数据了
RESTORE DATABASE `test` FROM 'local:///mnt/backup/2020/04/';
我还专门写了一个程序保存每次备份的记录。
因为开大了backup的并发。执行起来非常快。大表分钟级别。带宽打满50g
7.pitr
用pitr来保证多副本。绝对是一个馊主意。
因为oceanbase有他独一无二的2副本保证数据高可用。而tidb原本需要3副本数据保证数据不可丢。但现在我们用s3保存了。
这些功能叠加起来就是魔法攻击了。费用肯定比ob更省