windows本地调试hdfs java api踩坑记录
windows bug
-
bug描述及原因
hadoop主要基于linux编写,所以如果直接在windows上运行,会抛异常。 -
解决方式
- 下载并配置hadoop-winutils环境变量
HADOOP_HOME=D:\hadoop-common-2.2.0-bin-master
Path=%HADOOP_HOME%\bin
- 将hadoop-winutils的bin目录下的hadoop.dll复制到 C:\windows\system32 目录下
外网无法访问hdfs文件系统
- bug描述及原因
- 本地测试开发机器和服务器不在一个局域网
- 安装的hadoop配置文件是以内网ip作为机器间通信的ip
- 程序中配置namenode机器外网ip,此时namenode会将数据所在的机器ip地址提供给我们,用于访问数据传输服务,但是返回的是datanode内网的ip,我们无法根据该IP访问datanode服务器
- 此时就会出现如下错误:
2020-09-22 17:43:36.773 WARN 18208 --- [ main] org.apache.hadoop.hdfs.DFSClient : Failed to connect to /192.168.1.98:50010 for file /helloByJava/myUploadFile for block BP-49873749-192.168.1.7