Redis

在线人数统计业务是我们开发web肯定要设计的业务逻辑,本文就会给出几种设计方案,来分析下各个方案的优缺点:

 

  • 使用有序集合
这种方案能够同时储存在线的用户 和 用户上线时间,能够执行非常多的聚合计算,但是所消耗的内存也是非常可观的。
  • 使用集合
这种方案能储存在线的用户,也能够执行一定的聚合计算,相对有序集合,所消耗的内存要小些,但是随着用户量的增多,消耗内存空间也处于增加状态
  • 使用hyperloglog
这种方案无论统计多少在线用户, 消耗的内存都是12k,但是只能给出在线用户的统计信息,无法获取准确的在线用户名单
  • 使用bitmap
这种方案还是比较好的,在尽可能节省内存空间情况下,记录在线用户的情况,而且能做一定的聚合运算
 
下面我们就用实际例子来说明:
 
我们先以每天会有10w~30w的小量用户, 100w的用户群来说明下面的几种方案
 
方案一:使用有序集合
 
先生成用户在线记录数据:
 
[php]  view plain  copy
 
  在CODE上查看代码片 派生到我的代码片
  1. $start_time = mktime(0, 0, 0, 9, 5);    //monday  
  2. for ($i=0; $i < 6; $i++) {  
  3.     $day_start_time  = $start_time + 86400 * $i;    //every day begin time  
  4.     $day_end_time =  $day_start_time + 86400;       //every day end time  
  5.     $online_user_num = mt_rand(100000, 300000);     //online user between 100000 and 300000   
  6.   
  7.     for ($j=1; $j < $online_user_num$j++) {   
  8.         $user_id = mt_rand(1, 1000000);  
  9.         $redis->zadd('000|online_users_day_'.$i, mt_rand($day_start_time$day_end_time), $user_id);  
  10.     }  
  11. }  

好了记下来我们就来看看都能统计出哪些信息来吧
 
[php]  view plain  copy
 
  在CODE上查看代码片 派生到我的代码片
  1. //note: 统计每天的在线总人数  
  2. for ($i=0; $i < 6; $i++) {   
  3.     print_r($redis->zsize('000|online_users_day_'.$i). "\n");  
  4. }  
  5.   
  6. //note: 统计最近6天都在线的人数  
  7. var_dump($redis->zInter('000|online_users_day_both_6',   
  8.     [  
  9.     '000|online_users_day_0',   
  10.     '000|online_users_day_1',   
  11.     '000|online_users_day_2',   
  12.     '000|online_users_day_3',   
  13.     '000|online_users_day_4',   
  14.     '000|online_users_day_5'  
  15.     ]  
  16.     ));  
  17.   
  18. //note: 统计出近6天中共有多少上线  
  19. $redis->zunion('000|online_users_day_total_6', ['000|online_users_day_0''000|online_users_day_1''000|online_users_day_2''000|online_users_day_3''000|online_users_day_4''000|online_users_day_5']);  
  20.   
  21. //note: 统计某个时间段总共在线用户  
  22. print_r($redis->zcount('000|online_users_day_5'mktime(13, 0, 0, 9, 10), mktime(14, 0, 0, 9, 10)));  
  23.   
  24. //note: 统计某个时间段在线用户名单  
  25. print_r($redis->zrangebyscore('000|online_users_day_5'mktime(13, 0, 0, 9, 10), mktime(14, 0, 0, 9, 10),   
  26.     array('withscores' => TRUE)));  

不单单只有这些, 我们还能统计出早, 中, 午, 晚 等等时间段的用户在线情况,还有很多其他的,这就让我们发挥想象吧,是不是挺多的? 只是确实也相当耗费内存空间
 
方案二:使用集合
 
还是先来成用户在线记录数据:
 
[php]  view plain  copy
 
  在CODE上查看代码片 派生到我的代码片
  1. //note set 一般聚合  
  2. for ($i=0; $i < 6; $i++) {  
  3.     $online_user_num = mt_rand(100000, 300000);     //online user between 100000 and 300000   
  4.   
  5.     for ($j=1; $j < $online_user_num$j++) {   
  6.         $user_id = mt_rand(1, 1000000);  
  7.         $redis->sadd('001|online_users_day_'.$i$user_id);  
  8.     }  
  9. }  

好了记下来我们就来看看都能统计出哪些信息来吧
 
[php]  view plain  copy
 
  在CODE上查看代码片 派生到我的代码片
  1. //note 判断某个用户是否在线  
  2. var_dump($redis->sIsMember('001|online_users_day_5', 100030));  
  3.   
  4. //note 每天在线用户总量的统计  
  5. for ($i=0; $i < 6; $i++) {   
  6.     print_r($redis->ssize('001|online_users_day_'.$i). "\n");  
  7. }  
  8.   
  9. //note 对不同时间段的在线用户名单进行聚合  
  10. print_r($redis->sInterStore('001|online_users_day_both_4and5''001|online_users_day_4''001|online_users_day_5'). "\n");  
  11.   
  12. //note 对指定的时间段的在线用户名单进行统计  
  13. print_r($redis->sUnionStore('001|online_users_day_total_4add5''001|online_users_day_4''001|online_users_day_5'). "\n");  
  14.   
  15. //note 哪天上线哪天没上线  
  16. print_r($redis->sDiffStore('001|online_users_day_diff_4jian5''001|online_users_day_4''001|online_users_day_5'). "\n");  

是不是也挺不错的,先不要着急, 我们接着往下看
 
方案三:使用hyperloglgo
 
先来成用户在线记录数据:
 
[php]  view plain  copy
 
  在CODE上查看代码片 派生到我的代码片
  1. // note HyperLogLog 只需要知道在线总人数  
  2. for ($i=0; $i < 6; $i++) {  
  3.     $online_user_num = mt_rand(100000, 300000);     //online user between 100000 and 300000   
  4.     var_dump($online_user_num);  
  5.     for ($j=1; $j < $online_user_num$j++) {   
  6.         $user_id = mt_rand(1, 1000000);  
  7.         $redis->pfadd('002|online_users_day_'.$i, [$user_id]);  
  8.     }  
  9. }  

这种方案,我们来看看都能实现哪些业务呢
 
[php]  view plain  copy
 
  在CODE上查看代码片 派生到我的代码片
  1. $count = 0;  
  2. for ($i=0; $i < 3; $i++) {   
  3.     $count += $redis->pfcount('002|online_users_day_'.$i);  
  4.     print_r($redis->pfcount('002|online_users_day_'.$i). "\n");  
  5. }  
  6. var_dump($count);  
  7.   
  8. //note  3 days total online num  
  9. var_dump($redis->pfmerge('002|online_users_day_both_3', ['002|online_users_day_0''002|online_users_day_1''002|online_users_day_2']));  
  10. var_dump($redis->pfcount('002|online_users_day_both_3'));  

好少啊,是的, 这种方案仅仅只能统计出某个时间段在线人数的总量, 对在线用户的名单却无能为力,但是却挺节省内存的,对统计数据要求不多情况下 ,我们便可以考虑这种方案。
 
方案四:使用bitmap
 
笔者对这种方案其实挺喜欢的,消耗的内存空间不多, 统计的信息却挺多的,还是老步骤,先来生成数据:
 
[php]  view plain  copy
 
  在CODE上查看代码片 派生到我的代码片
  1. //note bitmap 综合前面3个的优缺点  
  2. for ($i=0; $i < 6; $i++) {  
  3.     $online_user_num = mt_rand(100000, 300000);     //online user between 100000 and 300000   
  4.   
  5.     for ($j=1; $j < $online_user_num$j++) {   
  6.         $user_id = mt_rand(1, 1000000);  
  7.         $redis->setbit('003|online_users_day_'.$i$user_id, 1);  
  8.     }  
  9. }  

接下来我们看看能满足的统计信息吧
 
[php]  view plain  copy
 
  在CODE上查看代码片 派生到我的代码片
  1. //note userid today whether online   
  2. var_dump($userid = mt_rand(1, 1000000));  
  3. var_dump($redis->getbit('003|online_users_day_5'$userid));  
  4.   
  5. //note how many user is online  
  6. var_dump($redis->bitcount('003|online_users_day_5'));  
  7.   
  8. //note 6 days both online  
  9. var_dump($redis->bitop('AND''003|online_users_day_both_6''003|online_users_day_0''003|online_users_day_1''003|online_users_day_2''003|online_users_day_3''003|online_users_day_4''003|online_users_day_5'));  
  10. var_dump($redis->bitcount('003|online_users_day_both_6'));  
  11.   
  12. //note 6 days total online  
  13. var_dump($redis->bitop('OR''003|online_users_day_total_6''003|online_users_day_0''003|online_users_day_1''003|online_users_day_2''003|online_users_day_3''003|online_users_day_4''003|online_users_day_5'));  
  14. var_dump($redis->bitcount('003|online_users_day_total_6'));  
  15.   
  16. //note 6 days only one online  
  17. var_dump($redis->bitop('XOR''003|online_users_day_only_one_6''003|online_users_day_0''003|online_users_day_1''003|online_users_day_2''003|online_users_day_3''003|online_users_day_4''003|online_users_day_5'));  
  18. var_dump($redis->bitcount('003|online_users_day_only_one_6'));  

怎么样? 是不是集合能统计的 这家伙也能统计出来? 而且消耗的内容还少。
 
对于这几种方案其实各有各的好处, 根据业务统计信息 来取相应的方案来实施吧,这样内存利用也就更合理了
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值