
hadoop
文章平均质量分 68
pan12jian
这个作者很懒,什么都没留下…
展开
-
mapreduce编程实例(2)-求最大值和最小值
在网站的数据统计中,有这样一种情原创 2014-05-20 18:01:21 · 4328 阅读 · 1 评论 -
mapreduce编程实例(1)-统计词频
今天开始把MapReduce Design Patterns这本书上原创 2014-05-19 19:41:50 · 4325 阅读 · 3 评论 -
mapreduce编程实例(3)-求平均值
这个实例解决问题是:计算每个小时中原创 2014-05-20 18:35:35 · 1924 阅读 · 0 评论 -
mapreduce编程实例(4)-求中位数和标准差
这个实例解决问题是:计算一天的每个小时中,网上新增多少条评论,并计算这些评论的平均长度。代码如下:原创 2014-05-20 19:01:10 · 4280 阅读 · 1 评论 -
mapreduce编程实例(6)-求TOP 10
在网站会员中,会员积分不同。此很原创 2014-06-04 14:01:37 · 1882 阅读 · 0 评论 -
mapreduce编程实例(7)-求所有用户ID
在网站评论中,有些用户评论过多次,有原创 2014-06-04 14:23:16 · 1125 阅读 · 0 评论 -
mapreduce编程实例(5)-统计各州用户数
其实这个也是wordcout的一种变形,它是统计每个州的用户数原创 2014-05-23 15:07:35 · 1652 阅读 · 0 评论 -
hdfs合并结果和hdfs内部拷贝
问题:当一个mapreduce程序的输入是很多个mapreduce的输出时,由于input原创 2014-07-01 14:35:17 · 5183 阅读 · 0 评论 -
hadoop SequenceFileOutputFormat与LzopCodec压缩问题
用mahout库做推荐系统,吗原创 2014-07-15 09:53:37 · 1200 阅读 · 0 评论