关于hash分区的问题


小弟在看分区相关的文章,有一点不解,看官方文档说Hash 分区则可以用于大量写入场景下的数据打散,这种打散有什么意义吗?会提升写入的速度吗?或者说有没有什么直观的收益点
还有如果使用分区表,会提升读数据的性能吗?

打散的目的是分散读写请求到不同的分区上,减少出现热点Region的概率,能够提升读写性能。举个例子,表中的客户ID是使用时间加上一个序号生成的,使用Hash分区按照客户ID分区,可以使不同客户的数据均匀分散到不同的分区上,后续针对不同客户数据的读写也被分散。如果按照RANGE分区,那一段时间产生的客户ID就有可能集中在同一分区甚至Region上,导致热点数据。下文有个例子可以参考一下

谢谢大佬

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。