hdaoop2.x (CDH4、5)下使用DFS Client(包含HA)

本文详细介绍了在Hadoop 2.x(CDH4)环境下,如何在不配置HA和使用HA场景下获取FileSystem,以及如何在使用HA场景下通过配置文件或代码嵌入方式实现自动切换功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、不使用HA场景

1.1 获取FileSystem(下称FS)方法一:

 

FileSystem fs = FileSystem.get(URI.create("hdfs://<nn_ip>:<nn_port>"), new Configuration());

 

1.2 获取FS方法二(★推荐):

Configuration conf = new Configuration();			
conf.set("fs.default.name", "hdfs://<nn_ip>:<nn_port>");
FileSystem fs = FileSystem.get(conf);

 

 

二、Hadoop2.x(CDH4)不配置HA场景

2.1 连接单台NN

    使用方式和1.2的代码是完全一样的,不需要任何代码变更。

 

三、Hadoop2.x(CDH4)使用HA场景

3.1 连接单台NN

    使用方式和1.2的代码是完全一样的,不需要任何代码变更。

 

3.2 使用nameservices,并支持自动切换,这里有两种方法:

方法一:使用配置文件

 

  • 使用1.2配置,"fs.default.name"配置为你的nameservices名称,如:"hdfs://venice"
  • 将线上core-site.xml和hdfs-site.xml放到你项目配置文件目录,如conf,确保程序运行后,这个目录会被加载到classpath,特别注意,要添加如下配置到你的hdfs-site.xml文件,否则NN失败不会切换:
  <property>
    <name>dfs.client.failover.proxy.provider.<your_nameservices></name>
    <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
  </property>

 

方法二:代码嵌入配置

  • 使用1.2配置方式,并设置如下值:
    • fs.default.name(hadoop2.0兼容1.0该配置项名称,也可使用"fs.defaultFS")
    • dfs.nameservices
    • dfs.ha.namenodes.<your_nameservices>
    • dfs.namenode.rpc-address.<your_nameservices>.xxx
    • dfs.namenode.rpc-address.<your_nameservices>.yyy
    • dfs.client.failover.proxy.provider.<your_nameservices>

HA配置总结

    方法一的优点是不需要修改代码,缺点是要维护配置文件,方法二要修改系统代码,但不需要维护配置文件

 

-end

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值