
海量数据处理
jaguar13
这个作者很懒,什么都没留下…
展开
-
大数据量处理专题
<br />1. 给你A,B两个文件,各存放50亿条URL,每条URL占用64字节,内存限制是4G,让你找出A,B文件共同的URL。 <br /><br />2. 有10个文件,每个文件1G, 每个文件的每一行都存放的是用户的query,每个文件的query都可能重复。要你按照query的频度排序<br /><br />3. 有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16个字节,内存限制大小是1M。返回频数最高的100个词<br /><br />4.海量日志数据,提取出某日访问百度次数最多转载 2010-06-09 19:02:00 · 788 阅读 · 0 评论 -
大数据量处理专题
1. 给你A,B两个文件,各存放50亿条URL,每条URL占用64字节,内存限制是4G,让你找出A,B文件共同的URL。 2. 有10个文件,每个文件1G, 每个文件的每一行都存放的是用户的query,每个文件的query都可能重复。要你按照query的频度排序3. 有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16个字节,内存限制大小是1M。返回频数最高的100个词4.海量日志数据...原创 2010-06-09 18:24:06 · 140 阅读 · 0 评论