【TiDB 4.0 PCTA 学习笔记】- 1.3 A Brief History About the TiDB database platform(TiDB 发展简史)@4班+王策 @微软

课程名称:课程版本(101/201/301)+ 课程名称

学习时长:

15min

课程收获:

了解了TiDB的发展历史

课程内容:

早期TiDB

可以认为是一个容量无限大的单机mySQL

  • 在计算和存储层面的无限拓展,可以分开拓展
  • 兼容mySQL语法和协议
  • 对应用透明的数据分片策略
  • 强一致性的分布式事务
  • 分为TiDB、PD、TiKV
    • TiDB:无状态的SQL引擎
    • TiKV:分布式KV存储引擎
    • PD:主管元数据的存储和TiKV中数据的调度

TiDB十分适合中台场景

  • 由于协议兼容,可以从各种mySQL库进行数据同步
  • 不需要数据分片,对应用透明
  • 实时汇总数据
  • 相当于可以将备机和中台合二为一

TiSpark

  • 优点:
    • 将单节点TiDB计算能力扩展为多节点的并行计算
    • 提供更快更稳定的分布式计算框架
    • 无缝接入大数据生态
  • 缺点:
    • 并发低
    • 消耗大量的计算资源
    • 维护难度较高

TiDB2.0+

  • 优化器从Basic Optimizer到RBO+CBO到Cascades Optimizer(WIP)
  • 执行器从火山模型到批量化执行再到向量化执行,以及更好的并发控制
  • 引入分区表,Index Merge,对复杂计算能力有巨大提升

TiFlash

  • 通过Raft Lerner向列存引擎同步数据
  • 通过标签实现物理隔离,AP、TP不再相互影响
  • 接受TiDB及TiSpark的读请求,通过Raft Learner同步写请求

今日TiDB

  • TiDB = HTAP
  • 既有行存也有列存,数据自动进行行列转换
  • 运行TP业务时,可以方便进行报表查询及数据处理