再看你举的例子,假设有一个 region 大小为 150MiB,满足前两组配置的要求需要进行 split,那么在 split 之后我们获得的 region 数量和大小是如何决策的?
当coprocessor.region-split-size
为 96MiB, 那么我们将获得左 75MiB 和右 75 MiB 两个 region,因为75<96不会继续再分裂,如果设置 coprocessor.region-split-size
为 40MiB,那么我们将先获左 75MiB 和右 75 MiB 两个 region,因为75>40,会继续分裂为4个37.5MiB的四个region。
另外一个问题,在使用 auto_increment
时,若 region 按上述方案 split,那么在 split
后所有的数据仍会集中写入在 split 后的最右侧的 region 上,此时我们所有的 region 的大小应几乎全部为 144MiB,而持续插入时只在最右侧的 region 上存在 0MiB-144MiB 的大小变化,一旦达到144MiB就会产生下一个region,所以如果在使用 auto_increment
时,确实会存在写热点的问题, 所以 TiDB 提供了 Split Region
语法,专门针对短时批量写入场景作优化。