BitMap

本文介绍了一种高效的数据处理算法——Bit-Map算法。通过使用Bit-Map算法,可以在有限的内存空间内处理大规模数据集,如快速判断一个整数是否存在于40亿个不重复的整数集合中。文章详细解释了Bit-Map算法的工作原理,并提供了C语言实现示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

转载于http://blog.51cto.com/zengzhaozheng/1404108
https://blog.youkuaiyun.com/hguisu/article/details/7880288
https://blog.youkuaiyun.com/v_july_v/article/details/6685962

一、概述

本文将讲述Bit-Map算法的相关原理,Bit-Map算法的一些利用场景,例如BitMap解决海量数据寻找重复、判断个别元素是否在海量数据当中等问题.最后说说BitMap的特点已经在各个场景的使用性。

二、Bit-Map算法

先看看这样的一个场景:给一台普通PC,2G内存,要求处理一个包含40亿个不重复并且没有排过序的无符号的int整数,给出一个整数,问如果快速地判断这个整数是否在文件40亿个数据当中?

问题思考:

40亿个int占(40亿*4)/1024/1024/1024 大概为14.9G左右,很明显内存只有2G,放不下,因此不可能将这40亿数据放到内存中计算。要快速的解决这个问题最好的方案就是将数据搁内存了,所以现在的问题就在如何在2G内存空间以内存储着40亿整数。一个int整数在java中是占4个字节的即要32bit位,如果能够用一个bit位来标识一个int整数那么存储空间将大大减少,算一下40亿个int需要的内存空间为40亿/8/1024/1024大概为476.83 mb,这样的话我们完全可以将这40亿个int数放到内存中进行处理。

具体思路:

1个int占4字节即4*8=32位,那么我们只需要申请一个int数组长度为 int tmp[1+N/32]即可存储完这些数据,其中N代表要进行查找的总数,tmp中的每个元素在内存在占32位可以对应表示十进制数0~31,所以可得到BitMap表:

tmp[0]:可表示0~31

tmp[1]:可表示32~63

tmp[2]可表示64~95

…….

那么接下来就看看十进制数如何转换为对应的bit位:

假设这40亿int数据为:6,3,8,32,36,……,那么具体的BitMap表示为:
这里写图片描述
三、Bit-Map算法原始实现

标注下,这部分来自blog:http://blog.youkuaiyun.com/hguisu/article/details/7880288的第五部分。好,来看看c语言的实现
//set 设置所在的bit位为1

void set(int i) {      
    a[i>>SHIFT] |=  (1<<(i & MASK));
}
//clr 初始化所有的bit位为0
void clr(int i) {      
    a[i>>SHIFT] &= ~(1<<(i & MASK));
}
//test 测试所在的bit为是否为1
int  test(int i){
    return a[i>>SHIFT] &   (1<<(i & MASK));
}                                                                      
int main()
{   int i;
    for (i = 0; i < N; i++)
        clr(i);
    while (scanf("%d", &i) != EOF)
        set(i);
    for (i = 0; i < N; i++)
        if (test(i))
            printf("%d\n", i);
    return 0;
}

注明: 左移n位就是乘以2的n次方,右移n位就是除以2的n次方

详细建议看转载的博客。

以下可以看问题的实例处理
https://blog.youkuaiyun.com/v_july_v/article/details/6685962

05-30
### Bitmap 技术与使用方法 Bitmap 是一种常见的图像表示方式,它将图像存储为像素矩阵,每个像素点包含颜色信息。以下是关于 Bitmap 的技术细节和使用方法的详细说明。 #### 1. Bitmap 的基本概念 Bitmap 图像由一组像素组成,每个像素的颜色值通过 RGB 或 ARGB 表示[^2]。在 Android 开发中,Bitmap 常用于加载、处理和显示图片。例如,可以通过 `BitmapFactory` 类提供的方法从资源文件、文件系统或网络流中解码图片。 #### 2. 创建和加载 Bitmap 在 Android 中,可以使用以下方法创建和加载 Bitmap: ```java // 从资源文件加载 Bitmap Bitmap bitmapFromResource = BitmapFactory.decodeResource(getResources(), R.drawable.image); // 从文件路径加载 Bitmap Bitmap bitmapFromFile = BitmapFactory.decodeFile("/path/to/image.jpg"); // 从字节数组加载 Bitmap byte[] imageData = ...; // 图像数据 Bitmap bitmapFromByteArray = BitmapFactory.decodeByteArray(imageData, 0, imageData.length); ``` 这些方法允许开发者根据需求选择不同的数据源来生成 Bitmap 对象[^2]。 #### 3. Bitmap 的压缩与优化 为了减少内存占用,可以对 Bitmap 行压缩。以下是一个示例代码,展示如何通过设置 `BitmapFactory.Options` 来调整图片大小和质量: ```java BitmapFactory.Options options = new BitmapFactory.Options(); options.inSampleSize = 2; // 缩小图片尺寸为原来的 1/2 Bitmap compressedBitmap = BitmapFactory.decodeFile("/path/to/image.jpg", options); ``` 上述代码通过设置 `inSampleSize` 参数实现图片的缩放,从而降低内存消耗。 #### 4. Bitmap 在用户人群分析中的应用 在用户数据分析领域,Bitmap 可以用于高效存储和操作大规模布尔型数据集。例如,在 Starrocks 数据库中,Bitmap 被广泛应用于用户群体的交集、并集和差集计算。这种技术能够显著提高查询性能,尤其是在处理海量数据时[^1]。 #### 5. RoaringBitmap 扩展 RoaringBitmap 是一种高效的 Bitmap 实现方案,特别适用于稀疏数据集的压缩和操作。在 PostgreSQL 中,`pg_roaringbitmap` 扩展提供了对 RoaringBitmap 的支持,允许开发者在数据库层面行复杂的集合运算[^4]。 #### 6. BitmapFont 渲染技术 BitmapFont 是一种用于游戏开发和其他图形界面的字体渲染技术。它通过预渲染的字符图像和 `.fnt` 文件定义字符位置,实现高效的文字绘制。以下是加载 BitmapFont 的示例代码: ```java BitmapFont font = new BitmapFont(Gdx.files.internal("font.fnt"), Gdx.files.internal("font.png"), false); font.draw(batch, "Hello World", 100, 100); ``` 这段代码展示了如何加载一个 BitmapFont 并将其绘制到屏幕上[^5]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值