HDFS 文件读取 (根据文件路径读取hdfs下的文件内容)

本文详细介绍了一种从Hadoop分布式文件系统(HDFS)中读取文件内容的方法。通过具体的Java代码示例,展示了如何配置HDFS客户端,遍历指定路径下的所有文件,包括子目录,并读取文件内容到字符串列表中。此方法适用于大数据处理场景,尤其是当需要对HDFS上的大量文件进行数据处理和分析时。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

/**
 * 根据文件路径读取hdfs下的文件内容
 * @param hdfsPath hdfs访问路径
 * @param pathName 要读取文件的全路径
 * @return
 */
public static List<String> fileReadFromHdfs(String hdfsPath,String pathName){
    List<String> list = new ArrayList<>();
    try {
        Configuration conf = new Configuration();
        URI uri = URI.create(hdfsPath);
        FileSystem hdfs = null;
        Path path = new Path(pathName);
        hdfs = FileSystem.get(uri, conf, "hdfs");
        log.info("----------------------------------");
        log.info("hdfs uri:"+uri);
        log.info("path: "+path);
        log.info("----------------------------------");
        FileStatus[] files = hdfs.globStatus(path);
        for (FileStatus file : files) {
            if (file.isDirectory()) {
                RemoteIterator<LocatedFileStatus> iterator = hdfs.listFiles(file.getPath(), false);
                while (iterator.hasNext()) {
                    LocatedFileStatus fileStatus = iterator.next();
                    Path fullPath = fileStatus.getPath();
                    System.out.println(fullPath);
                    log.info("---------文件夹下的子文件路径:"+fullPath);

                    //------start   获取到全路径  读取文件内容
                    FileSystem fs = FileSystem.get(URI.create(fullPath.toString()),conf);
                    FSDataInputStream hdfsInStream = fs.open(new Path(fullPath.toString()));
                    BufferedReader reader = new BufferedReader(new InputStreamReader(hdfsInStream));
                    String line = null;
                    while ((line=reader.readLine()) != null) {
                        System.out.println(line);
                        list.add(line.toString());
                    }
                    hdfsInStream.close();
                    fs.close();
                    //------end   获取到全路径  读取文件内容

                }
            } else {
                System.out.println(file.getPath());
            }
        }

    } catch (IOException e) {
        e.printStackTrace();
    } catch (InterruptedException e) {
        e.printStackTrace();
    }
    return list;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值