TiDB 写入慢流程排查系列(一)— 前言
背景
在使用及测试 TiDB 的过程中,不少用户会遇到 TiDB 集群写入性能差的问题,但是因为 TiDB 不仅包含 tidb server、tikv server、pd server 三大基础组件,还包含 Binlog、TiCDC、TiFlash 等周边生态组件,整体架构相对复杂,排查问题比较困难。所以在这个基础上,整理了 TiDB 写入操作的流程,以及对应环节的相关监控,希望该文档能在一定程度上帮助用户排查并定位 TiDB 集群写入性能慢的相关问题。
问题排查思路
TiDB 是一个比较复杂的系统,当出现写入性能慢的问题的时候。可能一些问题是比较常见的问题,还有一些问题可能并不常见。所以在整理写入慢排查文档的时候,将问题分为了两类,一类问题是典型问题,包括:
- 物理环境导致的写入慢,比如网路抖动,资源争抢,资源瓶颈等,
- 业务变更导致的,在上线之后,或者执行 DDL 之后集群出现写入慢的情况,那可能就是业务变更带来的影响
- 近期慢查询语句
- 写入热点问题
另一类是非典型问题,属于复杂问题,那就需要用户对照 TiDB 写入操作的步骤流程对集群进行排查,定位写入性能问题的原因并寻求解决方法。
文章大纲
本写入慢流程排查系列文档一共有五篇,分别是:
-
TiDB 写入慢流程排查系列(一)——前言
介绍系列文章的背景、排查思路、以及目录大纲 -
TiDB 写入慢流程排查系列(二)——典型问题排查
介绍写入性能慢的典型问题,包括物理环境排查,业务变动,写入热点问题的排查 -
TiDB 写入慢流程排查系列(三)——TiDB Server 写入流程
介绍 TiDB Server 写入流程步骤以及相关监控查看 -
TiDB 写入慢流程排查系列(四)——TiKV Server 写入流程
介绍 TIKV Server 写入流程步骤以及相关监控查看 -
TiDB 写入慢流程排查系列(五)——RocksDB 写入及 Compaction
介绍 RocksDB 写入流程,Compaction -
TiDB 写入慢流程排查系列(六)——GC 机制
介绍 TiDB GC 机制对写入的影响