【Hadoop二十】WebHDFS

本文介绍了如何通过HTTP REST API访问HDFS上的文件路径/user,提供了具体的访问地址及参数示例,并链接了官方文档供进一步查阅。

访问地址是

 

http://hadoop.bit.com:50070/webhdfs/v1/user?op=LISTSTATUS

 

其中的user是HDFS上的文件路径/user,

 

HTTP REST API的详细信息参看https://hadoop.apache.org/docs/r2.7.2/hadoop-project-dist/hadoop-hdfs/WebHDFS.html

Hadoop 中,**WebHDFS** 是一个基于 HTTP 的 REST 接口,用于访问 HDFS 文件系统。默认情况下,WebHDFS 在较新版本的 Hadoop(如 2.x 及以上)中是启用的,但如果你发现它未启用或需要手动配置,可以按照以下步骤操作: --- ### ✅ 启用 WebHDFS 的步骤: #### 1. **修改 `hdfs-site.xml` 配置文件** 确保以下配置项已添加到 `hdfs-site.xml` 文件中: ```xml <property> <name>dfs.webhdfs.enabled</name> <value>true</value> </property> ``` 此参数控制是否启用 WebHDFS REST API。 --- #### 2. **确认 HTTP 端口设置** WebHDFS 默认使用 NameNode 的 HTTP 端口(通常是 `50070` 对于 Hadoop 2.x,`9870` 对于 Hadoop 3.x)。 你可以通过以下配置项指定端口: ```xml <property> <name>dfs.http.address</name> <value>0.0.0.0:50070</value> </property> ``` 重启 NameNode 后生效。 --- #### 3. **重启 HDFS 服务** 修改配置后,需要重启 HDFS 服务以使更改生效: ```bash # 停止 HDFS stop-dfs.sh # 启动 HDFS start-dfs.sh ``` 或者根据你使用的集群管理工具(如 Ambari、Cloudera Manager)进行重启。 --- #### 4. **验证 WebHDFS 是否启用成功** 使用浏览器或 `curl` 访问如下地址: ``` http://<namenode-host>:50070/webhdfs/v1/?op=GETCONTENTSUMMARY ``` 如果返回类似如下 JSON 数据,说明 WebHDFS 已启用成功: ```json { "error": { "javaClassName": "java.lang.IllegalArgumentException", "message": "Invalid value for webhdfs parameter op: GETCONTENTSUMMARY" } } ``` 这表明接口已经存在,只是参数不完整。 --- ### 🔐 安全建议(可选) - 如果启用了 Kerberos 安全认证,需在访问 WebHDFS 时携带 Kerberos Ticket。 - 若使用 HTTPS,还需配置 SSL 相关参数。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值