在进行大批量加载的时候是否需要预先split索引

tidb在建表的时候可以通过shard_bit对表进行预散列 但是表上的索引只有一个region 那么这个region在入库的时候会不会造成热点 如果对这个索引的region进行split的话是不是可以提高数据加载的效率。

如果索引是递增或递减的话,会造成热点,即使预切分了也解决不了这个问题。可能hash分区有一定帮助,6.0版本开始有个shard index功能可以对Int 类型的递增索引做shard
https://docs.pingcap.com/zh/tidb/v6.0/tidb-functions

guid 类型的索引 和 非自增的是否可以通过split减少热点呢

只要不是递增的应该有一定效果,还有就是 预切分后新的region还是在原tikv上,可能要考虑设置下scatter变量,让他均衡到其他tikv

1 个赞

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。