文章目录 一、提出任务 二、准备工作 1、启动hadoop服务 2、上传数据文件到HDFS 3、创建Maven项目PartitionSort 4、修改pom.xml文件,添加依赖 5、创建log4j.properties文件 三、完成任务 1、创建SortPartitioner (1)分区思路:通过数字范围来判断 (2)分区思路:判断对应字符串长度 (3)分区思路:利用正则表达式 2、创建SortMapper 3、创建SortReducer 4、创建SortDriver 5、运行SortDriver,查看结果 四、项目下载 一、提出任务 原始数据: 82 239 231 23 22 213 123 232 124 213 3434 232 4546 565 123 231 231 2334