【TiDB 4.0 PCTA 学习笔记】- 3.7.8 How to Deal With Hotspot Issues（如何处理数据热点问题）@1班+杨一

yangyidba · 2021 年1 月 4 日 15:56

课程名称：课程版本（301）+ 3.7.8 How to Deal With Hotspot Issues

30

tidb上的热点成因以及如何解决。

热点的原因，干预手段，以及处理方法

写入请求集中在单个tikv实例。少量tikv实例表现cpu负载高，io压力大。

导致顺序写的原因大概有以下几种

特别小的数据被频繁访问，数据集中到一个region中。tikv无法调度手段解决负载问题。导致热点小表的原因

此时需要观察coprocessor metrics 的监控数据。小范围的更新操作也会导致热点小表现象。

包含多个region的表，其数据不一定是均匀分布的，此现象成为数据倾斜。如果该表被频繁访问，数据集中的那个region 可能会有性能瓶颈。

Tidb 使用基于hash的分区表解决热点问题，在底层数据分布不同的分区就是不同的表。表创建完成就包含多个region，Tidb能更快的完成数据调度。

SHARD_ROW_ID_BITS

针对rowid顺序写导致的热点问题。创建表或者通过alter 设置该属性，启用该特性之后新写入的数据不是严格递增而是随机生成。
预分裂region

效果最好，根据表的数据量把region提前分裂合适的数量，可以主动调度将空的region均匀的分布到tikv中。要求对数据分布比较了解。
follow read
主要解决小表的读热点问题。该特性允许从follower replica上读取数据。可以通过tidb_replica_read 参数来分配流量

set tidb_replica_read=‘follower’

set tidb_replica_read=‘leader + and + follower’
scatter range

pd 将表的region 平均的分布到整个tikv中。
开启

curl -X POSThttp://{TiDBIP}:10080/tables/{db}/{table}/scatter

关闭，等待调度完成，需要及时关闭

curl -X POST http://{TiDBIP}:10080/tables/{db}/{table}/stop-scatter
shuffle leader/region
当前面的方式无法解决region倾斜时，可以采用shuffle leader/region作为非常规手段。
随机移动leader或副本；shuffle leader解决读热点问题；shuffer region解决写热点问题；通过pd-ctl控制调度器

创建：

pd-ctl scheduler add shuffle-region-scheduler
pd-ctl scheduler add shuffle-leader-scheduler

删除：

pd-ctl scheduler remove shuffle-region-scheduler
pd-ctl scheduler remove shuffle-leader-scheduler

TiDB_学习助手 · 2021 年1 月 20 日 10:02

同学你好，感谢参与 TiDB 4.0 课程的学习！

本篇笔记逻辑清晰、内容丰富，被评选为优质笔记，将额外获得 20 积分，并在「TiDB 培训」分类下获得“置顶”权益，积分兑换规则将于近期开放，敬请关注！

期待您继续产出优质内容！

system · 2022 年10 月 31 日 19:07

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。