课程笔记 TiDB 快速起步(下)

课程链接

TiDB 快速起步

课程大纲

  • 数据库、大数据与 TiDB 的发展简史

    • 01: 数据库、大数据发展历史与趋势

    • 02: 分布式关系数据库的发展

    • 03: TiDB 产品与开源社区演进

  • TiDB 整体概述

    • 04: 我们到底需要一个什么样的数据库

    • 05: 如何构建一个分布式存储系统

    • 06: 如何构建一个分布式 SQL 引擎

  • 新一代 HTAP 数据库选型

    • 07: 基于分布式架构的 HTAP 数据库

    • 08: TiDB 关键技术创新

    • 09: TiDB 典型应用场景及用户案例

  • TiDB 初体验

    • 10: TiDB 初体验

课程笔记(下)

  1. OLTP:追求高并发、低延迟

  2. OLAP:追求吞吐量

  3. tidb用于数据中台

    1. 海量存储允许多数据源汇聚,数据实时同步

    2. 支持标准SQL,多表关联快速出结果

    3. 透明多业务模块、支持分表聚合后可以任务维度查询

    4. tidb最大下推机制、以及并行hash join等算子

  4. 引入spark(只能提供低并发的重量级查询)来缓解数据中台算力问题

  5. 列存天然对OLAP查询类友好

  6. TiFlash以raft learner方式接入multi-raft组,使用异步方式传输数据,对TiKV产生非常小的负担。

  7. 算力再次不匹配,引入MPP

  8. 通过网络与存储成本来置换计算资源

  9. HTAP下一步探索

    1. 数据服务统一

    2. 产品内嵌功能的迭代,由一些具体产品来完成HTAP

    3. 整合多个技术栈与产品,并进行数据的连同,形成服务的HTAP

  10. 数据仓库的阶段

    1. 批处理(ETL)离线数仓

    2. 批流结合lambda架构

    3. 流计算为主Kappa架构

  11. 分布式的KV存储系统

  12. 分布式SQL计算系统

  13. 分布式的HTAP架构系统

  14. 自动分片技术是更细维度弹性的基础

  15. 弹性的分片构建成了动态的系统

    1. 96MB自增分片

    2. 20MB合并分片

  16. 基于multi-raft将复制组更离散

  17. 基于multi-raft实现写入的线性扩展

  18. 基于multi-raft实现跨IDC单表多节点写入

  19. 去中心化的分布式事务

  20. local read and geo-partition

  21. 更大数据容量下的TP与AP融合

  22. 数据服务的统一:tidb的cbo可以采集行列cost模型进行配置

  23. 典型场景

    1. OLTP Scale 高扩展联机(高并发、大数据量、高可用性)

    2. real-time htap

  24. 分表、分库、中间件Proxy

  25. 表过大导致性能下降与B-tree

  26. TiUP是TiDB4.0版本引入的集群运维工具

  27. TiUP的playground组件用于部署本地集群