mysql中主键设成自增_MySQL中主键是否需要设置为自增？

weixin_39603327

于 2021-01-20 02:48:10 发布

阅读量1.5k

点赞数

文章标签： mysql中主键设成自增

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_39603327/article/details/113298450

版权

本文探讨了数据库中自增主键的使用，解释了为何多数表选择自增int作为主键。主键自增能避免数据页频繁分裂，提高InnoDB表的写入效率。聚集索引按照主键顺序存放数据，自增主键确保新数据在索引末尾添加，减少页分裂。设置自增且无业务意义的主键可优化写入性能，但若能确保主键值按升序增长，也可避免性能问题。对于分库的表，主键设计需考虑全局唯一性和性能因素。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在之前很多节中，细心的朋友应该发现，绝大多数表的主键都选择了自增的 int 型字段。为什么这样设计呢？本节就来聊聊这个话题。

关于自增主键

当我们创建表时，可以定义主键为自增的，具体方法如下：

CREATE TABLE `t25` (

`id` int(11) NOT NULL AUTO_INCREMENT,

`a` int(11) NOT NULL,

`b` char(2) NOT NULL,

PRIMARY KEY (`id`),

KEY `idx_a` (`a`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

空表情况下，我们不指定 id 字段写入数据时，id 字段会自动获取到值 1，如下：

首先写入一条数据，没指定 id 的值：insert into t25(a,b) values (1,'hi');

再进行查询时，发现 id 字段自动获取到值 1：select * from t25;

这里我们查询一下表 t25 的表结构：show create table t25;

发现表结构中包含 AUTO_INCREMENT=2，在下一次执行未指定 id 字段的 insert 语句时，主键 id 会自动获取到这个值。

insert into t25(a,b) values (2,'ha');

select * from t25;

发现新写入的数据 id 自动获取到 2 这个值。也就是，如果不指定，则会写入当前最大 ID 加 1 的值。

主键和聚集索引的关系

很多同学会把主键和聚集索引弄混，这里先简单聊聊它们的区别：

在 InnoDB 中，聚集索引不一定是主键，但是主键一定是聚集索引：原因是如果没有定义主键，聚集索引可能是第一个不允许为 null 的唯一索引，如果也没有这样的唯一索引，InnoDB会选择内置 6 字节长的ROWID 作为隐含的聚集索引。

我们在讲解聚集索引的时候，知道了 InnoDB 的数据是按照主键顺序存放的，而聚集索引就是按照每张表的主键构造一颗 B+ 树，它的叶子节点存放的是整行数据。

每张 InnoDB 表都有一个聚集索引，但是不一定有主键。

主键是否需要设置为自增

现在来讨论本节的重点：主键是否需要设置为自增？

通过上面的学习，我们知道了聚集索引是按照每张表的主键构造一棵 B+ 树的，而 B+ 树中，所有记录节点都是按键值的大小顺序存放在同一层叶子节点上。

如果每次插入的数据都是在聚集索引树的后面，聚集索引不需要分裂就可以存入数据。

但是如果插入的数据值在聚集索引树的中间部分，由于要保证插入后叶子节点中的记录依然排序，就可能需要聚集索引树分裂来保证键值的有序性。如下(这里省略了叶子节点之间的指针)：

如上图，Leaf Page(叶子节点数据页)已经满的情况下，如果写入的值是聚集索引树的中间部分，则会进行一次页分裂，以保证叶子节点上的记录有序和 B+ 树的平衡。并且分裂后，有些数据页没被用满，导致页空间浪费。

因此如果业务输入的主键都是随机数字，那么写入数据时很可能会导致数据页频繁分裂，从而影响写入效率。

而如果设置主键是自增，那么每一次都是在聚集索引的最后增加，当一页写满，就会自动开辟一个新页，不会有聚集索引树分裂这一步，效率会比随机主键高很多。这也是很多建表规范要求主键自增的原因。

除了要求主键自增外，最好主键也要无业务意义，原因是防止主键更新而导致页分裂的情况。

当然也不是所有的情况主键都需要设置为自增，比如可以用程序写入增长的主键值，保证了新写入数据的主键值比之前大，也可以避免聚集索引树频繁分裂。

总结

本节讨论了自增主键的使用方式，并讲解了主键与聚集索引的关系。

通过本节学习，如果主键是随机的，那么写入数据时很可能会导致数据页频繁分裂，从而导致写入效率低和页空间浪费。

而如果设置主键是自增，那么每一次都是在聚集索引的最后增加，当一页写满，就会自动开辟一个新页，不会有聚集索引树分裂这一步，效率会比随机主键高很多。

当然也不是所有的表都需要设置为自增，如果通过业务逻辑给到表主键的值是增长的(不一定连续)，保证了新写入数据的主键值比之前大，也可以避免聚集索引树频繁分裂。这种方式也是可以选择的。

思考题

对于分库的表，你们是怎么设置主键的？

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。