idea内 hdfs API 操作

本文详细介绍如何使用Java API进行Hadoop文件系统的操作,包括文件夹和文件的创建、内容的添加与追加、以及文件内容的读取。通过具体示例展示了在HDFS中进行文件管理的全过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.hdfs.server.common.JspHelper;
import org.apache.hadoop.yarn.webapp.hamlet.Hamlet;
import org.mortbay.util.Scanner;

import java.io.*;
import java.net.URI;
public class Test1 {
    private static Configuration conf = new Configuration();

    public static void main(String[] args) throws Exception{
        // addFiles();
        // addFile();
        // appendSomeThings();
        readFile();
        // addSomeThings();
   }

    //创建一个文件夹
    private static void addFiles() throws Exception{
        FileSystem fs = FileSystem.get(new URI("hdfs://192.168.100.150:8020"),conf);
        boolean mkdirs = fs.mkdirs(new Path("/abba"));
        if(mkdirs){
            System.out.println("ok");
        }else {
            System.out.println("?");
        }
    }

    //在上一个创建的文件夹内创建一个文件
    private static void addFile() throws Exception{
        FileSystem fs = FileSystem.get(new URI("hdfs://192.168.100.150:8020"),conf);
        boolean b = fs.createNewFile(new Path("/abba/a.txt"));
        if(b){
            System.out.println("ok");
        }else {
            System.out.println("?");
        }
    }

    //文件添加内容
    private static void addSomeThings() throws Exception {

        FileSystem fs = FileSystem.get(new URI("hdfs://192.168.100.150:8020"),conf);
        FSDataOutputStream append = fs.append(new Path("/abba/a.txt"));
        BufferedWriter bf =new BufferedWriter(new OutputStreamWriter(append));

        bf.write("  这一行没换行");

        //换行
        bf.newLine();
        bf.write("这一行换行");

        bf.close();
        fs.close();
    }

    //文件内容追加
    private static void appendSomeThings() throws Exception {

        FileSystem fs = FileSystem.get(new URI("hdfs://192.168.100.150:8020"),conf);
        FSDataOutputStream append = fs.append(new Path("/abba/a.txt"));
        append.write("hello world !".getBytes());
        append.close();
        fs.close();
    }

    //读取文件内容
    private static void readFile() throws Exception {

        FileSystem fs = FileSystem.get(new URI("hdfs://192.168.100.150:8020"),conf);
        InputStream is = fs.open(new Path("/abba/a.txt"));
        BufferedReader bf = new BufferedReader(new InputStreamReader(is));

        String s = null;
        while ((s = bf.readLine()) != null){
            System.out.println(s);
        }

        is.close();
        bf.close();
        fs.close();

    }
}
HDFS (Hadoop Distributed File System) 是 Apache Hadoop 平台的核心组件,用于分布式存储大规模数据。在 IntelliJ IDEA 2023 版本中操作 HDFS,通常会用到 Hadoop 的官方 Java API 包 org.apache.hadoop.fs。 以下是基本的 HDFS Java API 操作步骤: 1. **添加依赖**:在你的 Maven 或 Gradle 项目配置文件(pom.xml 或 build.gradle)中添加 Hadoop 核心库的依赖。例如,Maven 里添加如下: ```xml <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-client</artifactId> <version>3.x.y</version> <!-- 更新到合适的版本 --> </dependency> ``` 2. **创建 FileSystem 对象**:通过 `FileSystem` 类的静态方法 `get()` 来获取一个对 HDFS 文件系统实例的引用,需要提供集群的名称节点地址作为构造函数参数: ```java Configuration conf = new Configuration(); conf.set("fs.defaultFS", "hdfs://namenode.example.com:9000"); FileSystem fs = FileSystem.get(conf); ``` 3. **读取和写入文件**: - **上传文件**:可以使用 `create()`、`append()` 和 `write()` 方法上传文件到指定路径: ```java Path path = new Path("/path/to/file"); DataOutputStream out = fs.create(path); // 写入数据... out.close(); ``` - **下载文件**:使用 `open()` 和 `read()` 方法读取文件内容: ```java DataInputStream in = fs.open(path); byte[] buffer = new byte[4096]; int bytesRead; while ((bytesRead = in.read(buffer)) != -1) { // 处理读取的数据... } in.close(); ``` 4. **删除文件和目录**: ```java boolean result = fs.delete(path, true); // 第二个参数表示是否递归删除整个目录 ``` 5. **关闭连接**: ```java fs.close(); ```
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值