大数据之-Hadoop本地模式_执行Grep官方案例---大数据之hadoop工作笔记0021

本文介绍了如何在Hadoop的本地模式下执行Grep案例,用于理解和调试。首先创建input目录并复制etc/hadoop/*.xml到其中,然后使用hadoop-mapreduce-examples.jar中的grep例子,寻找以dfs开头的xml文件。执行命令需确保output目录不存在,否则会报错。成功执行后,结果将保存在output目录的part-r-00000文件中。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

然后我们再继续看帮助文档,可以看到有个standalone operation 独立操作.

这里本地模式,说hadoop默认被配置为,不是分布式的mode,也就是上面独立操作模式,做为一个单独的java进程运行,这样的模式对于调试测试是很有用的.

 

然后下面是个例子,说,把conf文件夹中的xml文件都copy到input,这个文件夹中,然后,我们用提供的案例,来按照指定的正则表达式,来找到

对应的文件,以及统计文件的个数

 

可以看到上面就是首先创建了一个文件夹input,然后把etc/hadoop/*.xml中的所有的xml文件都放入了input中,然后

执行了一个jar,去找到以dfs开头的xml文件.

这里dfs[a-z.]+ 是一个正则表达式,这个就不多说了.

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

添柴程序猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值