tidb5.0 聚集索引疑问

田帅萌7 · 2021 年6 月 23 日 09:18

为提高效率，请提供以下信息，问题描述清晰能够更快得到解决：

【概述】：场景 + 问题概述

【背景】：做过哪些操作

【现象】：业务和数据库现象

【问题】：当前遇到的问题

tidb5.0的 AUTO_RANDOM 必须是聚集索引。

问题1
但原本的AUTO_RANDOM shard bits 是不是就不好使了？

问题2
我有批量归档的表单表200G*16 的数据存到tidb 这样就会有热点数据写入

我是继续使用 AUTO_RANDOM +聚集索引或者 AUTO_INCREMENT+唯一索引+shard bits 那个更好一点

如果使用AUTO_RANDOM +聚集索引的话出现了写热点问题咋处理呢

【业务影响】：

【TiDB 版本】：v5.0.2

【附件】：

田帅萌7 · 2021 年6 月 23 日 09:59

聚集索引明确了

如果我批量插入到主建是随机的呢 id（1，10000，9999）这种
会重新排列嘛？（这里是指物理存储的顺序）
改成1 9999 10000 这样

yilong · 2021 年6 月 28 日 02:45

可以试试参考这个文档的回答
https://asktug.com/t/topic/93819

xfworld · 2021 年6 月 28 日 05:30

官方给的方案也可以解决：

田帅萌7 · 2021 年6 月 29 日 03:52

5.0的聚集索引可能会发生热点问题
而AUTO_RANDOM 本身是为了避免热点问题而产生。如果是4.0 自增类型选 AUTO_RANDOM 是没疑问的。
如果是5.0的话选AUTO_RANDOM 会强制为聚集索引。
那么AUTO_RANDOM为了避免热点的意义就不大了。

yilong · 2021 年7 月 1 日 13:07

不是很明白，聚簇索引，auto_random 和 auto_increment 不会同时使用。

比较担心的场景是什么？举个例子，比如要创建什么样类型的表？担心会有热点？

田帅萌7 · 2021 年7 月 2 日 03:53

1.不能同时使用。
2.大批量同时写入 mysql分片写入tidb 现在已经有50亿单表+100亿单表的数据量写入。担心会产生热点问题。

因为数据还会有大量的增长。也有查询的需求

auto_random +聚簇索引 vs auto_increment 主建那个在热点的场景更好。
5.0的版本如使用 auto_random 为主建则默认开启聚集索引。
聚集索引是会有热点场景发生。

qizheng · 2021 年7 月 2 日 06:45

auto_random 一个目的是为了解决热点问题，在业务没有使用 id 生成器产生随机 id 的情况下，作为 DB 层的解决方案帮助生成随机 id，虽然是聚簇索引，但可以起到打散写入热点的效果
auto_random +聚簇索引 vs auto_increment + 唯一索引+ shard bits 的打散效果基本一样，但后者多写了一个索引，如果 mysql 迁移过来不方便改造为 auto_random，可以沿用之前的 auto_increment 并改为唯一索引；如果迁移时仍然使用 auto_increment 作为主键，为了避免热点，4.0.13 版本也支持在线将 auto_increment 主键修改为 auto_random https://github.com/pingcap/tidb/pull/24608

田帅萌7 · 2021 年7 月 2 日 08:19

good 感谢老师的指点

system · 2022 年10 月 31 日 19:03

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。