mysql uuid 前缀索引_Mysql使用Java UUID作为唯一值时使用前缀索引测试

最新推荐文章于 2025-07-26 00:20:11 发布

weixin_39681724

最新推荐文章于 2025-07-26 00:20:11 发布

阅读量240

点赞数

CC 4.0 BY-SA版权

文章标签： mysql uuid 前缀索引

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_39681724/article/details/113912123

本文探讨了在MySQL中使用字符串前缀作为索引来节省存储空间的方法，通过测试UUID生成的32位字符串，分析不同长度前缀的索引选择性。随着数据量增加，前缀索引的选择性会降低，例如在2000万数据时，前7位和前9位的索引选择性分别为0.96和0.9999。建议根据业务数据量选择合适的前缀长度，以平衡索引效率和空间占用。前缀索引虽节省空间，但不支持ORDER BY和GROUP BY查询，也不能作为覆盖索引使用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Mysql可以使用字符串前缀作为索引以节约空间。

下面我们以 Java的UUID 生成的 32位(移除UUID中的中划线)字符串来做一下测试。

表结构：

CREATE TABLE `test_uuid` (

`id` int(10) unsigned NOT NULL AUTO_INCREMENT,

`uuid` varchar(36) DEFAULT NULL,

PRIMARY KEY (`id`)

) ENGINE=InnoDB AUTO_INCREMENT DEFAULT CHARSET=utf8

UUID生成的方式(不考虑replaceAll的替换效率)：

UUID.randomUUID().toString().replaceAll("-", "")

查询不同长度的前缀索引效率(索引的选择性，即不重复的索引值)的SQL:

select

count(DISTINCT uuid) / count(*) as total,

count(DISTINCT LEFT(uuid,5)) / count(*) as five,

count(DISTINCT LEFT(uuid,6)) / count(*) as six,

count(DISTINCT LEFT(uuid,7)) / count(*) as seven,

count(DISTINCT LEFT(uuid,8)) / count(*) as eight,

count(DISTINCT LEFT(uuid,9)) / count(*) as nine,

count(DISTINCT LEFT(uuid,10)) / count(*) as ten

from test_uuid;

下面看一下测试数据及结果：

20W数据

40W

60W

80W

100W

200W

300W

500W

1000W

2000W

随着数据量的增多，同样长度的前缀索引选择性逐渐降低。

前7位在2000W数据的时候损失了 0.04，也就是说每100 条数据，会有4条与其他96条数据有重复。

前9位在2000W数据的时候损失了 0.0001 ，也就是说每10000 条数据，会有1 条与其他 9999条有重复。

前10位在2000W数据的时候选择行依然为1 (前10位没有任何重复的)。

大家可以算一下 26的10次方，大概是 141 万亿。

当然，以上数据我只做过一次，其他测试数据应该与本次测试数据稍有不同，但可以肯定的是：不会相差很多。

所以，当业务需要使用 uuid 作为业务唯一的key时，可以评估业务数据量，选择合适长度的前缀索引。

前缀索引的选择性越接近总长度索引的选择性时，说明已经可以了。

但是，前缀索引有一些缺点：

1. Mysql 前缀索引不支持 order by 和 group by 查询。

2 Mysql 前缀索引不能作为覆盖索引使用。

各位大佬有问题，欢迎交流。

原文：https://www.cnblogs.com/selfchange/p/11240818.html

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。