
MapReduce编程
该专栏包括MapReduce编程的系列文章,去重、排序、单表关联、Elasticsearch for Hadoop等问题都能在这里找到答案。
esc_ai
这个作者很懒,什么都没留下…
展开
-
MapReduce编程(四) 求均值
MapReduce编程统计学生成绩的平均值,StringTokenizer和Split的用法对比原创 2017-03-31 13:28:34 · 2422 阅读 · 0 评论 -
MapReduce编程(五) 单表关联
MapReduce编程实现单表关联,挖掘爷孙关系 一、问题描述 下面给出一个child-parent的表格,要求挖掘其中的父子辈关系,给出祖孙辈关系的表格。原创 2017-03-31 17:41:00 · 3522 阅读 · 0 评论 -
MapReduce编程(六) 从HDFS导入数据到Elasticsearch
Elasticsearch for Hadoop安装以及如何从HDFS导入数据到Elasticsearch原创 2017-04-01 19:26:20 · 12803 阅读 · 7 评论 -
MapReduce编程(七) 倒排索引构建
使用Lucene 6.0对文本进行中文分词,然后使用MapReduce构建倒排索引,统计文档频率和总的词项频率原创 2017-04-04 16:31:49 · 3624 阅读 · 0 评论 -
MapReduce编程(三) 排序
MapReduce编程之排序问题一、问题描述文件中存储了商品id和商品价格的信息,文件中每行2列,第一列文本类型代表商品id,第二列为double类型代表商品价格。数据格式如下原创 2017-03-31 11:10:34 · 5657 阅读 · 1 评论 -
MapReduce编程(二) 文件合并和去重
MapReduce编程实现文件合并和去重:对输入的多个文件进行合并,并剔除其中重复的内容,去重后的内容输出到一个文件中。原创 2017-03-30 23:59:27 · 11216 阅读 · 0 评论 -
MapReduce编程(一) Intellij Idea配置MapReduce编程环境
介绍如何在Intellij Idea中通过创建maven工程配置MapReduce的编程环境。原创 2017-03-30 20:37:22 · 30464 阅读 · 7 评论