文章目录 一、预备工作 1、启动hadoop服务 2、准备数据文件 2、将数据文件上传HDFS 二、实现步骤 1、创建Maven项目GetMaxTemperatures 2、修改pom.xml文件,添加hadoop依赖 3、在resources目录下创建log4j.properties文件 4、第一阶段工作——读取文件中的每行数据 (1)编写MaxMapper (2)编写MaxDriver 5、第二阶段工作——提取每行数据里的年份与温度 (1)修改MaxMapper (2)修改MaxDriver 6、第三阶段工作——相同年份数据归并 (1)编写MaxReducer (2)修改MaxDriver 7、第四阶段工作——获取每年最高温度 (1)修改MaxReducer (2)修改MaxDriver 8、实现按键降序输出 (1)自定义Year类 (2)修改MaxMapper (3)修改MaxReducer (4)修改MaxDriver 三、项目下载 四、课后练习 一、预备工作 1、启动hadoop服务 [root@tiger ~]# start-dfs.sh [root@tiger ~]# start-yarn.sh 2、准备数据文件 2329999919500515070000