数据结构应用:位图索引

本文探讨了数据库中的位图索引,通过案例分析展示了如何使用位图索引进行快速查找。位图索引适用于列基数小、重复值多的场景,尤其在查询涉及多个条件时效率较高。但不适用于频繁更新的列和重复度过低的列。文章还对比了位图索引与B+Tree索引的优劣。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  • 上篇文章提到了数据结构位图,位图是利用bit数组来存储数据的结构,由于bit是计算机的最小存储单位,因此这种数据结构是非常节省存储空间的;同时计算机本来就是二进制的运算,利用位图来进行一些查找/去重操作是比较快的,这篇文章来谈谈数据库中的位图索引

一、案例分析

namegendermaritalstatus
阿虎male已婚
阿杰male未婚
阿吉female已婚
阿白female离婚
阿彪male未婚

如想查出所有已婚的女性,转换成sql为:select * from t where t.gender = ‘female’ and maritalstatus = ‘已婚’;
1、不使用任何索引,就会全表扫描
2、使用索引:
1)B+Tree/BTree索引,都是使用多叉树的形式,因为性别和婚姻状况基本都占50%数据,基本要取出一半数据,要扫描多次BTree,所以完全没有必要;若是列重复值少,且基数大,可以考虑使用BTree索引
2)位图索引
类似于BitMap,生成只包含0和1的数组,比如male,每列若是male就标为1,若是female就标为0;female相反

Rowid12345
male11001
female00110
Rowid12345
已婚10100
未婚01001
离婚00010

当使用上述sql进行查询时

Rowid12345
female00110
位与(&)
已婚10100
result00100

可以看出result为1的在第三行,第三行是满足条件的
二、适用场景

  • 数据库中列基数比较少,且有大量重复值
  • 不适用于OLTP场景,或经常更新的列
  • 不适用于重复度过低的列,逻辑与、或运算很快,不建议作为单列查询

参考链接:位图索引理解

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值