cloudera hadoop CDH目录下Hadoop-streaming.jar等其他jar包的路径

本文分享了作者在使用Hadoop进行大数据处理过程中的经验心得。详细介绍了在学校集群环境下寻找并使用hadoop-streaming-jar包的过程,包括两种查找方法及相关的环境配置文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景

前面我是在自己的电脑上搭建分布式环境hadoop,做了一些实验,但是就今天下午上传了一个300多MB的文件,然后进行处理都非常的慢,估计没有几个小时是弄不完的。于是想起前面借用学校的一个集群,也折腾了一下,但是就是不知道他的目录结构,要找什么东西都找不到,是用cloudera进行管理和配置的,我想用hadoop-streaming-*jar来运行python脚本。于是网上百度,终于找到了!

正文

参考博客:
hadoop基础—-hadoop实战(十一)—–hadoop管理工具—CDH的目录结构了解
第一种:
ls /opt/cloudera/parcels/CDH/jars

可以看到:
hadoop-streaming-2.6.0-cdh5.12.0.jar
hadoop-streaming-2.6.0-mr1-cdh5.12.0.jar
应该就是它了!
第二种:
ls /opt/cloudera/parcels/CDH/lib/hadoop-mapreduce

可以看到:
hadoop-streaming-2.6.0-cdh5.12.0.jar
hadoop-streaming.jar
其他资料:
Cloudera hadoop配置文件地址和修改配置属性方法
可以看到环境配置文件:
core-site.xml hadoop-env.sh hdfs-site.xml log4j.properties mapred-site.xml ssl-client.xml topology.map topology.py yarn-site.xml

[root@cdh1 expers]# yarn jar /opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/lib/hadoop-mapreduce/hadoop-streaming.jar \ > -D mapreduce.job.queuename=default \ > -files mapper.py,reducer.py \ > -mapper "python mapper.py" \ > -reducer "python reducer.py" \ > -input /user/dr/exper.txt \ > -output /user/dr/output WARNING: YARN_OPTS has been replaced by HADOOP_OPTS. Using value of YARN_OPTS. packageJobJar: [] [/opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/jars/hadoop-streaming-3.0.0-cdh6.3.2.jar] /tmp/streamjob4915326641913657665.jar tmpDir=null 25/03/18 21:20:15 INFO client.RMProxy: Connecting to ResourceManager at cdh1/192.168.153.90:8032 25/03/18 21:20:16 INFO client.RMProxy: Connecting to ResourceManager at cdh1/192.168.153.90:8032 25/03/18 21:20:17 INFO mapreduce.JobResourceUploader: Disabling Erasure Coding for path: /user/root/.staging/job_1742297342561_0008 25/03/18 21:20:17 INFO mapred.FileInputFormat: Total input files to process : 1 25/03/18 21:20:18 INFO mapreduce.JobSubmitter: number of splits:2 25/03/18 21:20:18 INFO Configuration.deprecation: yarn.resourcemanager.system-metrics-publisher.enabled is deprecated. Instead, use yarn.system-metrics-publisher.enabled 25/03/18 21:20:18 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1742297342561_0008 25/03/18 21:20:18 INFO mapreduce.JobSubmitter: Executing with tokens: [] 25/03/18 21:20:18 INFO conf.Configuration: resource-types.xml not found 25/03/18 21:20:18 INFO resource.ResourceUtils: Unable to find 'resource-types.xml'. 25/03/18 21:20:19 INFO impl.YarnClientImpl: Submitted application application_1742297342561_0008 25/03/18 21:20:19 INFO mapreduce.Job: The url to track the job: http://cdh1:8088/proxy/application_1742297342561_0008/ 25/03/18 21:20:19 INFO mapreduce.Job: Running job: job_1742297342561_0008 25/03/18 21:20:24 INFO mapreduce.Job: Job job_1742297342561_0008 running in uber mode : false 25/03/18 21:20:24 INFO mapreduce.Job: map 0% reduce 0% 25/03/18 21:20:24 INFO mapredu
最新发布
03-19
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

涛歌依旧fly

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值