hive遇到的问题:The ownership on the staging directory /tmp/hadoop-yarnis not as expectedThe directory mus

本文记录了一次在使用Hive过程中遇到的权限问题及其解决过程。主要问题是当使用root用户执行Hive查询时,因目录所有者为hadoop而导致权限不足。通过调整目录所有者和权限,最终成功执行了查询。

搭建好了hive,由于切换到hadoop无法进入hive,权限不足,于是切换到root,执行:

hive history file=/tmp/hadoop/hive_job_log_hadoop_201407010908_503942368.txt
hive>
hive>select count(*) from test;
后出现:

java.io.IOException: The ownership on the staging directory /tmp/hadoop-yarn/staging/root/.staging is not as expected. It is owned by hive. The directory must be owned by the submitter root or by root
	at org.apache.hadoop.mapreduce.JobSubmissionFiles.getStagingDir(JobSubmissionFiles.java:120)
	at org.apache.hadoop.mapreduce.JobSubmitter.submitJobInternal(JobSubmitter.java:146)
	at org.apache.hadoop.mapreduce.Job$11.run(Job.java:1341)
	at org.apache.hadoop.mapreduce.Job$11.run(Job.java:1338)
	at java.security.AccessController.doPrivileged(Native Method)
	at javax.security.auth.Subject.doAs(Subject.java:421)
如上省略了一些,这问题提示是需要root权限,退出hive,执行:

hadoop fs -chown -R root:root /tmp
然而并未修改成功:

chmod: changing permissions of '/tmp/hadoop-yarn': Permission denied: user=root, access=EXECUTE, inode="/tmp":hive:hive:drwxrwx--

切换成hadoop用户,执行上面的修改权限指令,成功!原因。。。。是因为root没有权限修改hadoop?因为我的所有权是hadoop的,这问题待解答。。

上面命令修改后:结果如下:

hive> SELECT COUNT(*) FROM test;
Query ID = root_20180128162626_f875d94a-9ada-47c0-8af8-b9b37271c64a
Total jobs = 1
Launching Job 1 out of 1
Number of reduce tasks determined at compile time: 1
In order to change the average load for a reducer (in bytes):
  set hive.exec.reducers.bytes.per.reducer=<number>
In order to limit the maximum number of reducers:
  set hive.exec.reducers.max=<number>
In order to set a constant number of reducers:
  set mapreduce.job.reduces=<number>
Starting Job = job_1517036563281_0005, Tracking URL = http://master:8088/proxy/application_1517036563281_0005/
Kill Command = /usr/local/hadoop/bin/hadoop job  -kill job_1517036563281_0005
Hadoop job information for Stage-1: number of mappers: 1; number of reducers: 1
2018-01-28 16:26:58,698 Stage-1 map = 0%,  reduce = 0%
2018-01-28 16:27:06,402 Stage-1 map = 100%,  reduce = 0%, Cumulative CPU 1.32 sec
2018-01-28 16:27:13,780 Stage-1 map = 100%,  reduce = 100%, Cumulative CPU 2.05 sec
MapReduce Total cumulative CPU time: 2 seconds 50 msec
Ended Job = job_1517036563281_0005
MapReduce Jobs Launched: 
Stage-Stage-1: Map: 1  Reduce: 1   Cumulative CPU: 2.05 sec   HDFS Read: 6436 HDFS Write: 2 SUCCESS
Total MapReduce CPU Time Spent: 2 seconds 50 msec
OK
0
Time taken: 33.905 seconds, Fetched: 1 row(s)






### Hadoop YARN导出任务中的IOException问题分析 在Hadoop YARN环境中,`/tmp/hadoop-yarn/staging`目录的所有权错误通常会导致`IOException`。此问题可能源于用户权限配置不当或HDFS中相关目录的权限设置不正确[^1]。以下是针对该问题的详细分析和解决方案: #### 1. 权限配置问题 YARN的staging目录用于存储作业的临时文件和元数据。如果Hive用户(或其他提交作业的用户)没有对该目录的写入权限,则会引发`IOException`。通常,staging目录应由`yarn`用户或具有适当权限的用户创建,并确保其他用户能够访问和写入[^2]。 #### 2. 检查HDFS权限 可以通过以下命令检查`/tmp/hadoop-yarn/staging`目录的权限: ```bash hdfs dfs -ls /tmp/hadoop-yarn/staging ``` 如果输出显示目录的所有者不是当前运行YARN服务的用户(如`yarn`),或者权限不足以允许其他用户写入,则需要调整权限[^3]。 #### 3. 修改目录权限 如果发现权限不足,可以使用以下命令修改目录的所有权和权限: ```bash # 将目录所有权更改为yarn用户 hdfs dfs -chown yarn:hadoop /tmp/hadoop-yarn/staging # 设置适当的权限以允许写入 hdfs dfs -chmod 770 /tmp/hadoop-yarn/staging ``` #### 4. 配置文件检查 确保Hadoop配置文件(如`core-site.xml`和`yarn-site.xml`)中与staging目录相关的参数正确设置。例如,`yarn.nodemanager.local-dirs`和`yarn.nodemanager.log-dirs`应指向有效的本地路径[^4]。 #### 5. Hive特定问题 当使用Hive进行导出操作时,可能会遇到额外的权限问题。确保Hive用户的主目录存在于HDFS中,并且其权限设置正确: ```bash # 创建Hive用户的主目录 hdfs dfs -mkdir -p /user/hive # 设置Hive用户的主目录权限 hdfs dfs -chown hive:hive /user/hive ``` #### 6. 日志排查 通过检查YARN日志和HDFS日志,可以进一步定位问题的根本原因。日志文件通常位于以下路径: - YARN日志:`$HADOOP_LOG_DIR/yarn-yarn-resourcemanager-*.log` - HDFS日志:`$HADOOP_LOG_DIR/hdfs-hdfs-namenode-*.log` #### 示例代码:检查和修复权限 以下脚本可以帮助自动检查和修复`/tmp/hadoop-yarn/staging`目录的权限问题: ```bash #!/bin/bash STAGING_DIR="/tmp/hadoop-yarn/staging" OWNER="yarn:hadoop" PERMISSIONS="770" # 检查目录是否存在 if hdfs dfs -test -d $STAGING_DIR; then echo "Directory exists: $STAGING_DIR" else echo "Creating directory: $STAGING_DIR" hdfs dfs -mkdir -p $STAGING_DIR fi # 设置所有权 echo "Setting owner to $OWNER for $STAGING_DIR" hdfs dfs -chown $OWNER $STAGING_DIR # 设置权限 echo "Setting permissions to $PERMISSIONS for $STAGING_DIR" hdfs dfs -chmod $PERMISSIONS $STAGING_DIR ``` ### 结论 通过上述方法,可以有效解决Hadoop YARN导出任务中的`IOException`问题,特别是与`/tmp/hadoop-yarn/staging`目录所有权相关的错误。确保HDFS权限、YARN配置以及Hive用户权限均正确设置是关键[^5]。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值