文章目录
主键使用自增ID还是UUID?
主键是数据库确保数据行在整表唯一性的保障。
使用自增ID,在innodb中主键索引作为聚簇索引存在,主键索引的B+树叶子节点上存储了主键索引以及行数据(按照顺序),如果主键索引是自增ID,那么只需要不断向后排列即可,如果是UUID,由于到来的ID与原来的大小不确定,数据插入会造成非常多的数据移动,然后导致产生很多的内存碎片,进而造成插入性能的下降。
使用自增id应该指定数据类型为unsigned bigint
,最大值为18446744073709551615。
但是在亿万级数据库中不能使用自增ID。在分布式环境下存在严重问题。假设在分布式环境下,三个数据库有三亿数据存放在三个数据库,可能存在如下问题。
- 资源浪费。自增主键必须连续只能采用范围分片的形式,但是如何缺点给数据库的最大存储容量呢?如果一个库可以存储1.5亿数据呢
- 尾部热点:最近插入的数据是最近经常需要使用的数据。使用hash法,可以提高这种效率。
Snowflake
在分布式环境下可以使用snowflaske(雪花算法)。
雪花算法(Snowflake)是 Twitter 公司分布式项目采用的 ID 生成算法。它主要是根据时间顺序,结合机器ID与序列,生成一个定长的数字。
可以保证是连续的而且在分布式系统中是唯一的。