大数据之简单统计单词的案例在本地eclipse运行

本文介绍如何在Eclipse中使用本地线程而非Linux进程,执行大数据单词计数任务。首先配置Hadoop环境变量,然后设定配置文件,指定输入输出路径,最终实现在Eclipse上运行大数据处理案例。

这是利用eclipse的线程代替linuxe的进程去执行

第一步:首先要将已经下载解压后的hadoop配置好相应的环境变量

第二步:

//创建配置文件对象
        Configuration conf=new Configuration(true);

也就是下面的两行代码复制到创建配置文件对象的下面
        //设置在本地运行的文件对象
        conf.set("mapreduce.framework.name", "local");
        // conf.set("fs.defaultFS", "hdfs://node01:9000");
        conf.set("fs.defaultFS", "file:///");

第三步:

//指定joB的原始的输入输出路径,通过参数传入
        FileInputFormat.setInputPaths(job, new Path("D://code//mr//wc//input//"));
        FileOutputFormat.setOutputPath(job, new Path("D://code//mr//wc//output//"));

当然这里也可以利用主方法的run configurations来传入参数:下面给出一个验证的小案例

本案的设置如下:

得到结果:

表名成功在本地的eclipse运行

posted on 2019-01-13 20:14 头发浓密似羊毛 阅读( ...) 评论( ...) 编辑 收藏

转载于:https://www.cnblogs.com/liyunfeng-deng/p/10263816.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值