Hadoop词频统计

这篇博客详细介绍了如何在已安装Hadoop和JAVA环境的条件下,进行词频统计的实践操作。首先,需要新建文本文件并制作JAVA代码的jar包。在Eclipse或IDEA中导出Runnable JAR file,然后将jar包上传到Hadoop服务器。接着,在Hadoop上创建文件夹,导入文本文件,并运行jar包进行词频统计。最后,检查运行结果以验证统计过程的成功。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Hadoop结课作业——mapreduce词频统计

前提

  • 已安装Hadoop下的两个组件HDFS和Mapreduce。
  • 已安装JAVA语言编译软件Eclipse或IDEA。
  • 新建一个任意内容的文本文件。
    在这里插入图片描述

制作jar包

  • 编写JAVA代码。
import java.io.IOException;
import java.util.Iterator;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;
public class WordCount {
   
   
    public WordCount() {
   
   
    }
     public static void 
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值