Redis:Bitmaps使用场景-用户签到、统计活跃用户、用户在线状态

本文深入讲解Redis中的BitMap数据结构,探讨其在用户签到、活跃用户统计及在线状态跟踪等场景的应用,揭示如何利用setbit、getbit及bitcount等命令高效存储和查询大量二进制数据。
在Redis中我们经常用到set,get等命令,细心的你有没有发现,还有几个相似的命令叫setbit,getbit,它们是用来干嘛的?

BitMap是什么

就是通过一个bit位来表示某个元素对应的值或者状态,其中的key就是对应元素本身。我们知道8个bit可以组成一个Byte,所以bitmap本身会极大的节省储存空间。

Redis中的BitMap

Redis从2.2.0版本开始新增了setbit,getbit,bitcount等几个bitmap相关命令。虽然是新命令,但是并没有新增新的数据类型,因为setbit等命令只不过是在set上的扩展。

setbit命令介绍

指令 SETBIT key offset value
复杂度 O(1)
设置或者清空key的value(字符串)在offset处的bit值(只能只0或者1)。

空间占用、以及第一次分配空间需要的时间

在一台2010MacBook Pro上,offset为2^32-1(分配512MB)需要~300ms,offset为2^30-1(分配128MB)需要~80ms,offset为2^28-1(分配32MB)需要~30ms,offset为2^26-1(分配8MB)需要8ms。<来自官方文档>
大概的空间占用计算公式是:($offset/8/1024/1024)MB

使用场景一:用户签到

很多网站都提供了签到功能(这里不考虑数据落地事宜),并且需要展示最近一个月的签到情况,如果使用bitmap我们怎么做?一言不合亮代码!

<?php
$redis = new Redis();
$redis->connect('127.0.0.1');


//用户uid
$uid = 1;

//记录有uid的key
$cacheKey = sprintf("sign_%d", $uid);

//开始有签到功能的日期
$startDate = '2017-01-01';

//今天的日期
$todayDate = '2017-01-21';

//计算offset
$startTime = strtotime($startDate);
$todayTime = strtotime($todayDate);
$offset = floor(($todayTime - $startTime) / 86400);

echo "今天是第{$offset}天" . PHP_EOL;

//签到
//一年一个用户会占用多少空间呢?大约365/8=45.625个字节,好小,有木有被惊呆?
$redis->setBit($cacheKey, $offset, 1);

//查询签到情况
$bitStatus = $redis->getBit($cacheKey, $offset);
echo 1 == $bitStatus ? '今天已经签到啦' : '还没有签到呢';
echo PHP_EOL;

//计算总签到次数
echo $redis->bitCount($cacheKey) . PHP_EOL;

/**
* 计算某段时间内的签到次数
* 很不幸啊,bitCount虽然提供了start和end参数,但是这个说的是字符串的位置,而不是对应"位"的位置
* 幸运的是我们可以通过get命令将value取出来,自己解析。并且这个value不会太大,上面计算过一年一个用户只需要45个字节
* 给我们的网站定一个小目标,运行30年,那么一共需要1.31KB(就问你屌不屌?)
*/
//这是个错误的计算方式
echo $redis->bitCount($cacheKey, 0, 20) . PHP_EOL;

BITCOUNT的坑

redis> BITCOUNT bits

(integer) 0

redis> SETBIT bits 1 1          

(integer) 0

redis> SETBIT bits 2 1

(integer) 0

redis> BITCOUNT bits

(integer) 2

redis> BITCOUNT bits 2 -1

(integer) 0
  1. 为什么我设置了bitcount的start后会取不到值?
    “redis的setbit修改的是bit位置,而bitcount检查的是byte位置,两者相差有8的倍数”,再看文档确实是有这个说明,不过太不明显了
    所以在setbit 前把offset * 8 才可以。

代码如下:

$redis = new Redis();

$redis->connect('127.0.0.1', 6379, 10);


// 乘以8的原因是这个操作修改的是bit位置

$start = 1;

$offset = $start * 8;

$redis->setBit('bit', $offset, 1);

$count = $redis->bitCount('bit', $start, -1);

var_dump($count);
  1.  

使用场景二:统计活跃用户

使用时间作为cacheKey,然后用户ID为offset,如果当日活跃过就设置为1
那么我该如果计算某几天/月/年的活跃用户呢(暂且约定,统计时间内只有有一天在线就称为活跃),有请下一个redis的命令
命令 BITOP operation destkey key [key ...]
说明:对一个或多个保存二进制位的字符串 key 进行位元操作,并将结果保存到 destkey 上。
说明:BITOP 命令支持 AND 、 OR 、 NOT 、 XOR 这四种操作中的任意一种参数

//日期对应的活跃用户

$data = array(

'2017-01-10' => array(1,2,3,4,5,6,7,8,9,10),

'2017-01-11' => array(1,2,3,4,5,6,7,8),

'2017-01-12' => array(1,2,3,4,5,6),

'2017-01-13' => array(1,2,3,4),

'2017-01-14' => array(1,2)

);



//批量设置活跃状态

foreach($data as $date=>$uids) {

$cacheKey = sprintf("stat_%s", $date);

foreach($uids as $uid) {

$redis->setBit($cacheKey, $uid, 1);

}

}



$redis->bitOp('AND', 'stat', 'stat_2017-01-10', 'stat_2017-01-11', 'stat_2017-01-12') . PHP_EOL;

//总活跃用户:6

echo "总活跃用户:" . $redis->bitCount('stat') . PHP_EOL;



$redis->bitOp('AND', 'stat1', 'stat_2017-01-10', 'stat_2017-01-11', 'stat_2017-01-14') . PHP_EOL;

//总活跃用户:2

echo "总活跃用户:" . $redis->bitCount('stat1') . PHP_EOL;



$redis->bitOp('AND', 'stat2', 'stat_2017-01-10', 'stat_2017-01-11') . PHP_EOL;

//总活跃用户:8

echo "总活跃用户:" . $redis->bitCount('stat2') . PHP_EOL;

假设当前站点有5000W用户,那么一天的数据大约为50000000/8/1024/1024=6MB

使用场景三:用户在线状态

前段时间开发一个项目,对方给我提供了一个查询当前用户是否在线的接口。不了解对方是怎么做的,自己考虑了一下,使用bitmap是一个节约空间效率又高的一种方法,只需要一个key,然后用户ID为offset,如果在线就设置为1,不在线就设置为0,和上面的场景一样,5000W用户只需要6MB的空间。

//批量设置在线状态
$uids = range(1, 500000);

foreach($uids as $uid) {

$redis->setBit('online', $uid, $uid % 2);

}

//一个一个获取状态

$uids = range(1, 500000);

$startTime = microtime(true);

foreach($uids as $uid) {

echo $redis->getBit('online', $uid) . PHP_EOL;

}

$endTime = microtime(true);

//在我的电脑上,获取50W个用户的状态需要25秒

echo "total:" . ($endTime - $startTime) . "s";




/**

* 对于批量的获取,上面是一种效率低的办法,实际可以通过get获取到value,然后自己计算

* 具体计算方法改天再写吧,之前写的代码找不见了。。。

*/

其实BitMap可以运用的场景很多很多(当然也会受到一些限制),思维可以继续扩散~欢迎小伙伴给我留言探讨~

转载:https://segmentfault.com/a/1190000008188655

相关阅读:Redis中BitMap是如何储存的,以及PHP如何处理

<think>好的,用户现在问的是“java redis Bitmaps”。我需要先理解用户的需求。他们可能是在问如何在Java中使用Redis的位图(Bitmaps)功能。位图是Redis的一种数据结构,适用于处理二进制数据,比如统计用户签到在线状态等。 首先,我应该回顾一下RedisBitmaps相关命令,比如SETBIT、GETBIT、BITCOUNT等。然后考虑Java中常用的Redis客户端,比如Jedis和Lettuce,如何操作这些命令。用户可能希望得到具体的Java代码示例,说明如何使用这些命令。 接下来,用户可能的应用场景是什么?比如用户签到系统,记录用户每天的签到情况,或者统计活跃用户。这时候需要给出实际的例子,比如用用户ID作为偏移量,设置对应的位,并计算总签到人数。此外,还要考虑位图的大小和性能问题,比如处理大用户量时的内存优化。 然后,用户可能关心如何正确使用这些功能,比如如何避免常见的错误,比如偏移量过大导致内存不足,或者如何高效地进行位操作。同时,可能需要提到线程安全和原子操作,确保数据一致性。 另外,用户可能是在微服务架构下使用Redis,所以需要结合之前的对话,可能涉及分布式场景下的应用,比如分布式计数或状态同步。但当前问题更偏向于技术实现,所以重点应放在Java代码示例和使用技巧上。 我需要确保回答的结构清晰,先介绍Bitmaps的基本概念和常用命令,然后在Java中的具体使用方法,包括代码示例,接着是应用场景和注意事项。最后,按照用户的要求,生成相关问题,帮助用户进一步深入理解。 检查是否有遗漏点,比如是否需要提到Spring Data Redis使用,或者是否需要比较不同的客户端库。根据用户之前的对话,他们可能对微服务中的Redis部署有一定了解,但当前问题更关注具体数据结构的使用,所以可以专注于Java实现部分。 最后,确保相关问题符合要求,覆盖位图的不同应用场景、性能优化、数据结构比较以及持久化注意事项。这样用户可以得到全面的信息,帮助他们更好地应用Bitmaps在实际项目中。</think>Redis Bitmaps 是基于字符串类型实现的位操作功能,通过将字符串视为二进制数组,可以高效存储和操作海量布尔状态(如用户签到、活跃状态等)。以下是 Java 中的使用方法及场景分析: --- ### **1. Java 操作 Redis Bitmaps 的核心命令** 使用 **Jedis** 或 **Lettuce** 客户端时,核心方法对应 Redis 原生命令: - **SETBIT key offset value** ```java jedis.setbit("key", offset, true); // 设置指定偏移量的位为1 ``` - **GETBIT key offset** ```java boolean isSet = jedis.getbit("key", offset); // 获取指定偏移量的位值 ``` - **BITCOUNT key [start end]** ```java long count = jedis.bitcount("key"); // 统计所有为1的位数量 ``` - **BITOP operation destkey key [key ...]** ```java jedis.bitop(BitOP.AND, "destKey", "key1", "key2"); // 位运算(AND/OR/XOR/NOT) ``` --- ### **2. 典型应用场景与 Java 示例** #### **场景1用户签到统计** ```java // 用户ID为10012023-10-01签到记录 String key = "sign:20231001"; long offset = 1001; // 用户ID作为偏移量 jedis.setbit(key, offset, true); // 统计当天总签到人数 long totalSign = jedis.bitcount(key); System.out.println("当日签到人数:" + totalSign); ``` #### **场景2活跃用户分析(7日留存)** ```java // 假设7天的签到记录存储在sign:20231001到sign:20231007 String destKey = "7day_active"; jedis.bitop(BitOP.OR, destKey, "sign:20231001", "sign:20231002", ...); // 合并7天记录 long activeUsers = jedis.bitcount(destKey); System.out.println("7日活跃用户数:" + activeUsers); ``` #### **场景3:布隆过滤器(简易实现)** 通过多 Hash 函数映射多个位,减少冲突概率: ```java // 伪代码示例 String bloomKey = "bloom_filter"; List<Integer> hashValues = getHashValues("user123"); // 生成多个Hash值 for (int hash : hashValues) { jedis.setbit(bloomKey, hash, true); } ``` --- ### **3. 注意事项** - **偏移量上限**:Redis 的 offset 最大支持 2^32(约512MB/键),超大 offset 会导致内存占用激增。 - **性能优化**:批量操作时使用 Pipeline 减少网络开销。 - **原子性**:`SETBIT` 和 `BITOP` 是原子操作,适合高并发场景- **内存计算**:1亿用户占用约 **12MB/天**(100,000,000位 ≈ 12MB)。 --- ### **4. 相关问题**
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值