TIDB4.0的业务应用方式和一些疑问

我们公司现在业务包括两部分:
1:复杂的OLAP操作(每条sql都10几张以上关联,现在最大的表量级是千万级别,未来2-3年会达到亿级。复杂的查询中有较大比例是统计查询)
2:业务实时性的操作,数据量小,但频率高(增、删、改、简单查)。
现阶段新增数据每小时在 万级别,未来几年会达到数十万级别。业务sql操作需要毫秒级的返回。

为了更好应用TIDB,我想架构是这样的:
实例 个数 配置
TIDB 2台 32G/8核
PD 3台 8G/4核
TIKV 3台 32G/8核
Tiflash 1台 16G/4核
Tispark 3台 16G/4核

开发两个连接信息:TIDB和Tispark
1:复杂的OLAP,去访问Tispark。
2:业务操作,去访问TIDB。

问题列表:

  1. 上面的架构应用是否合理?如有问题请给出指导建议
    2.官网看到了这个图,有些疑问

TIDB和TiSpark都是可以访问tikv和tiflash是吗?
但是请求去选择tikv还是tiflash,这个是程序自动判断吗?那判断的标准是什么?会不会出现一个复杂的查询判断错误去查tikv?可以进行人工指定走tikv还是tiflash吗?

3、tiflash是需要自己去配置哪些表用tiflash吗?那我选择的标准是什么?表数据量大的还是使用频繁的,还是建议OLAP用的表都放到tiflash里

  1. 比官方推荐的小哟,后面ap的组件依赖于内存哟,TiDB如果导数据也要好多内存哟,具体怎么合理,测试罗,以监控为主
  2. 走TIDB入口访问,内部会根据执行计划选择较优的;也可以使用hint,来选择使用哪锅。误判嘛,肯定是有的哟,看下默认执行计划,不是你要的,就hint强制执行
  3. tiflash默认不同步任何表,需要同步的,update副本数即可,你说的标准应该是看ap语句在行列的抉择吧——

我也是刚了解tidb,用它做小型数仓,强答该问题,题主莫信

楼上同学的反馈没有问题