我们公司现在业务包括两部分:
1:复杂的OLAP操作(每条sql都10几张以上关联,现在最大的表量级是千万级别,未来2-3年会达到亿级。复杂的查询中有较大比例是统计查询)
2:业务实时性的操作,数据量小,但频率高(增、删、改、简单查)。
现阶段新增数据每小时在 万级别,未来几年会达到数十万级别。业务sql操作需要毫秒级的返回。
为了更好应用TIDB,我想架构是这样的:
实例 个数 配置
TIDB 2台 32G/8核
PD 3台 8G/4核
TIKV 3台 32G/8核
Tiflash 1台 16G/4核
Tispark 3台 16G/4核
开发两个连接信息:TIDB和Tispark
1:复杂的OLAP,去访问Tispark。
2:业务操作,去访问TIDB。
问题列表:
- 上面的架构应用是否合理?如有问题请给出指导建议
2.官网看到了这个图,有些疑问
TIDB和TiSpark都是可以访问tikv和tiflash是吗?
但是请求去选择tikv还是tiflash,这个是程序自动判断吗?那判断的标准是什么?会不会出现一个复杂的查询判断错误去查tikv?可以进行人工指定走tikv还是tiflash吗?
3、tiflash是需要自己去配置哪些表用tiflash吗?那我选择的标准是什么?表数据量大的还是使用频繁的,还是建议OLAP用的表都放到tiflash里