引出 是老张说的腾讯的面试题
说 昨天有一亿个QQ登陆啦
今天又有一亿个
问...
找到这两天重复登录的
bloom filter
于是有下面几个链接
http://blog.youkuaiyun.com/jiaomeng/archive/2007/01/27/1495500.aspx
http://blog.redfox66.com/redfox66/blog/post/2010/09/24/mass-data-topic-2-bloom-filter.aspx
上面两个进行了阐述概念
http://blog.zol.com.cn/658/article_657087.html
这个主要说了几个场合 特别适合用bloom filter
http://my.oschina.net/xtxb/blog/3853
这个主要讲了下 counting bloom filter
这个题是否适合mapReduce呢 分块处理
本文讨论了一道腾讯面试题:如何找出两天内重复登录的一亿个QQ账号。文章介绍了使用布隆过滤器(Bloom Filter)来解决大规模数据集中的重复元素问题,并探讨了此问题是否适合采用MapReduce进行分块处理。
1979

被折叠的 条评论
为什么被折叠?



