spark任务读取hdfs文件在hdfs HA模式时识别不了 UnknownHostExecption

最新推荐文章于 2023-12-27 16:45:07 发布

原创

最新推荐文章于 2023-12-27 16:45:07 发布 · 1.6k 阅读

2 ·

CC 4.0 BY-SA版权

Spark任务在HDFS HA模式下读取HDFS文件时出现UnknownHostExecption，原因是Spark配置文件中缺少HDFS配置文件。解决办法是将hdfs-site.xml与core-site.xml拷贝到Spark节点的conf目录，更改并修改spark-defaults.conf，加入文件路径，最后重启Spark并重新提交任务。

spark任务读取hdfs文件在hdfs HA模式时识别不了 UnknownHostExecption

ava.lang.IllegalArgumentException: java.net.UnknownHostException:ha
   at org.apache.hadoop.security.SecurityUtil.buildTokenService(SecurityUtil.java:418)
   at org.apache.hadoop.hdfs.NameNodeProxies.createNonHAProxy(NameNodeProxies.java:231)
   at org.apache.hadoop.hdfs.NameNodeProxies.createProxy(NameNodeProxies.java:139)
   at org.apache.hadoop.hdfs.DFSClient.<init>(DFSClient.java:510)
   at org.apache.hadoop.hdfs.DFSClient.<init>(DFSClient.java:453)
   at org.apache.hadoop.hdfs.DistributedFileSystem.initialize(DistributedFileSystem.java:136)
   at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:2433)
   at org.apache.hadoop.fs.FileSystem.access$200(FileSystem.java:88)
   at org.apache.hadoop.fs.FileSystem$Cache.getInternal(FileSystem.java:2467)
   at org.apache.hadoop.fs.FileSystem$Cache.get(FileSystem.java:2449)
   at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:367)
<