04使用api读取hdfs文件内容

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.URI;
import java.net.URISyntaxException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.junit.Before;
import org.junit.Test;



public class Read {
	
FileSystem fs = null;
@Before
public void init() throws Exception {
	Configuration conf = new Configuration();
	conf.set("dfs.replication", "2");
	conf.set("dfs.blocksize", "128m");
	fs.get(new URI("hdfs://hadoop1:9000"), conf, "root");
}

/*
 * 读取hdfs中的文件内容
 */
@Test
public void testReadDate() throws Exception {
	FSDataInputStream in = fs.open(new Path("/name.txt"));		
	BufferedReader br = new BufferedReader(new InputStreamReader(in, "utf-8"));
	
	String line = null;
	while((line=br.readLine()) != null) {
		System.out.println(line);
	}
	
	in.close();
	fs.close();
}



/*
 * 读取hdfs中指定偏移量范围内的内容
 */
@Test
public void testReadSeekDate() throws Exception {
	FSDataInputStream in = fs.open(new Path("/name.txt"));
	//将读取的起始位置进行指定
	in.seek(12);
	//读取16个字节
	byte[] buf = new byte[16];
	System.out.println(new String(buf));
	
	in.close();
	fs.close();
}

}
在Hadoop分布式文件系统(HDFS)中,HDFS API提供了一组Java接口和工具,用于与HDFS进行交互,包括读取文件。以下是使用Hadoop 2.x版本的HDFS API读取文件的基本步骤: 1. 导入必要的库:首先,你需要导入`org.apache.hadoop.conf.Configuration`和`org.apache.hadoop.fs.FileSystem`等HDFS相关的包。 ```java import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; ``` 2. 初始化配置:创建一个`Configuration`对象,并设置所需的HDFS连接信息,如默认名称节点地址。 ```java Configuration conf = new Configuration(); conf.set("fs.defaultFS", "hdfs://your namenode hostname:port"); ``` 将`your namenode hostname:port`替换为你实际的Hadoop集群的名称节点地址。 3. 创建文件系统实例:通过`FileSystem`的静态方法`get()`,使用配置创建一个`FileSystem`实例。 ```java FileSystem fs = FileSystem.get(conf); ``` 4. 定义文件路径:构建你要读取文件的`Path`对象。 ```java Path filePath = new Path("/path/to/your/file.txt"); ``` 5. 打开文件读取:调用`open()`方法打开文件,然后使用`DataInputStream`读取数据。 ```java try (DataInputStream in = fs.open(filePath)) { byte[] buffer = new byte[1024]; int bytesRead; while ((bytesRead = in.read(buffer)) != -1) { String line = new String(buffer, 0, bytesRead); System.out.println(line); } } catch (IOException e) { e.printStackTrace(); } ``` 6. 关闭文件:确保在完成操作后关闭`DataInputStream`和`FileSystem`。 ```java in.close(); fs.close(); ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

hao难懂

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值