课程名称:课程版本(101/201/301)+ 课程名称
学习时长:
15min
课程收获:
了解了TiDB的发展历史
课程内容:
早期TiDB
可以认为是一个容量无限大的单机mySQL
- 在计算和存储层面的无限拓展,可以分开拓展
- 兼容mySQL语法和协议
- 对应用透明的数据分片策略
- 强一致性的分布式事务
- 分为TiDB、PD、TiKV
-
- TiDB:无状态的SQL引擎
-
- TiKV:分布式KV存储引擎
-
- PD:主管元数据的存储和TiKV中数据的调度
TiDB十分适合中台场景
- 由于协议兼容,可以从各种mySQL库进行数据同步
- 不需要数据分片,对应用透明
- 实时汇总数据
- 相当于可以将备机和中台合二为一
TiSpark
- 优点:
-
- 将单节点TiDB计算能力扩展为多节点的并行计算
-
- 提供更快更稳定的分布式计算框架
-
- 无缝接入大数据生态
- 缺点:
-
- 并发低
-
- 消耗大量的计算资源
-
- 维护难度较高
TiDB2.0+
- 优化器从Basic Optimizer到RBO+CBO到Cascades Optimizer(WIP)
- 执行器从火山模型到批量化执行再到向量化执行,以及更好的并发控制
- 引入分区表,Index Merge,对复杂计算能力有巨大提升
TiFlash
- 通过Raft Lerner向列存引擎同步数据
- 通过标签实现物理隔离,AP、TP不再相互影响
- 接受TiDB及TiSpark的读请求,通过Raft Learner同步写请求
今日TiDB
- TiDB = HTAP
- 既有行存也有列存,数据自动进行行列转换
- 运行TP业务时,可以方便进行报表查询及数据处理