文章目录 一、提出任务 原始成绩数据 任务1、整合两个文件的成绩数据 任务2、统计每个学生各科平均分 二、准备工作 1、启动hadoop服务 2、上传数据文件到HDFS 3、创建Maven项目MultiInScore 4、修改pom.xml文件,添加依赖 5、创建log4j.properties文件 三、完成任务 1、创建ScoreRecordReader1 2、创建ScoreInputFormat1 3、创建ScoreRecordReader2 4、创建ScoreInputFormat2 5、创建ScoreMapper1 6、创建ScoreMapper2 7、创建ScoreDriver 8、运行ScoreDriver,查看结果 9、创建ScoreReducer 10、修改ScoreDriver,设置Reducer组件 11、运行ScoreDriver,查看结果 四、项目下载 一、提出任务 原始成绩数据 成绩表原始数据有两个文件score1.txt与score2.txt。 score1.txt: 李文霞 数学 90 英语 98 张晓峰 数学 78 英语 87 郑小翠 数学 87 英语 90 李文霞 数学 67 英语 87 张晓峰 数学 59 英语 80 郑小翠 数学 79 英语 60 score2.txt: 李文霞 数学 68