Mydumper到tidb的数据，进行操作报主键冲突

acuitong · 2020 年5 月 6 日 06:27

为提高效率，提问时请提供以下信息，问题描述清晰可优先响应。

【TiDB 版本】：2.1.10
【问题描述】：使用Mydumper从mysql向tidb导入一百八十万带主键的数据，在同一个事务中修改一条数据，以及新增一条数据(此新增数据的id不进行指定，按照主键自增长)，会出现主键冲突，考虑到tidb_server会缓存自增ID，试着直接插入当前数据，无异常

若提问为性能优化、故障排查类问题，请下载脚本运行。终端输出的打印结果，请务必全选并复制粘贴上传。

yilong · 2020 年5 月 6 日 06:43

acuitong · 2020 年5 月 6 日 06:56

表结构数据.txt (3.3 KB) 这个是表机构，以及事务和参考数据

acuitong · 2020 年5 月 6 日 06:57

这个是我们导入一定数据量出现的，在少量数据测试中没有发现此问题

acuitong · 2020 年5 月 6 日 08:11

上述问题我们的解决方案是将数据不指定id重新导入，使用tidb自增id生成，就没有问题了，是否有参数可以控制tidb_server缓存的id进行刷新

来了老弟 · 2020 年5 月 6 日 08:45

你好，

目前不支持，可以看下 tidb 在自增 id 方面的描述

acuitong · 2020 年5 月 6 日 10:01

如果按照这样指定tidb_server的情况会出现主键冲突，如果是proxy 采取加权轮询的方式，应该是会出现有时候能insert 成功有时候insert 失败的情况吧

来了老弟 · 2020 年5 月 6 日 10:05

你好，

上面的测试只是为了说明在何种情况可能出现主键冲突，如果使用的 proxy 仅为负载均衡，并且不手动输入 primary key，否则极少情况出现主键冲突。

acuitong · 2020 年5 月 7 日 02:57

现在有个问题就是，我导入的这一百八十万(会指定primary key )，如果只是一个事务单独进行insert，5000条测试成功率是百分之百，如果是一个事务中包含一条修改和一条不指定 primary key的insert，主键冲突率也是百分之百。

来了老弟 · 2020 年5 月 7 日 02:59

你好，可以将操作表的 auto_increment 设置大一点，超过导入的 180w 的数据，是否可行。

acuitong · 2020 年5 月 7 日 03:03

昨天解决生产问题，我们重新导入了这张表，使用的方式是没有指定主键，应该是把tidb_server的id缓存刷过了，测试原来有问题的表也没问题了

acuitong · 2020 年5 月 7 日 03:33

设置的话可以跳过，假如设置100，tidb_server会缓存30000个id ，这个时候下次id就是 30001，设置1000000，下次id就是1000000，这个时候没有根据前面的id数自增啊，这是啥机制

来了老弟 · 2020 年5 月 7 日 03:54

你好，

如果是使用上TiDB 中，自增列只保证自增且唯一，并不保证连续分配。