Hadoop Java 常用Api

package com.ws;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.*;
import org.junit.Before;
import org.junit.Test;

import java.io.BufferedInputStream;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.nio.charset.StandardCharsets;
import java.util.Arrays;
import java.util.HashMap;

public class JavaApi {
    FileSystem fs;
    String temp = "C:/Users/Wsong/Desktop/test/";

    private Path path(String path){
        return new Path(path);
    }
    @Before
    public void init() throws IOException {
        System.setProperty("HADOOP_USER_NAME","root");
        Configuration entries = new Configuration();
        entries.set("fs.defaultFS","hdfs://dream1:9000");
        fs = FileSystem.get(entries);
    }
    @Test
    public void testDelete() throws IOException {
        // 第二个参数是否递归
        fs.delete(path("/app1"),true);
    }
    // 创建目录
    @Test
    public void testMkdir() throws IOException {
        fs.mkdirs(path("/webapp/log"));
        fs.close();
    }
    // 移动,改名
    @Test
    public void testMvRename() throws IOException {
        // 只是针对最后一级目录
        fs.rename(path("/app/1"),new Path("/app1"));
        fs.close();
    }
    @Test
    public void testCopyFromLocal() throws IOException {
        // 不存在也不会报错
        // 从本地复制到hdfs上,注意 一定要写完整目录, 这样是复制到app1里
        fs.copyFromLocalFile(path(temp+"copy.txt"),path("/app1/copy.txt"));
        fs.close();
    }
    @Test
    public void testCopyFromLocalErro1() throws IOException {
        // 不存在也不会报错
        // 下面这种写法是复制并改名为app1文件 不管带不带/都是直接变成文件而不是目录
        fs.copyFromLocalFile(path(temp+"copy.txt"),path("/app1/"));
        fs.close();
    }
    @Test
    public void testCopyFromLocalErro2() throws IOException {
        // 不存在也不会报错
        // 下面这种写法是复制并改名为app1文件 不管带不带/都是直接变成文件而不是目录
        fs.copyFromLocalFile(path(temp+"copy.txt"),path("/app1"));
        fs.close();
    }
    @Test
    public void testCopyFromLocalErro3() throws IOException {
        // 不存在也不会报错
        fs.copyFromLocalFile(path(temp+"copy.txt"),path("/app1/copy.txt"));
        // 第一个true 这是说删除本地文件并上传也就是剪切,第二个true是说如果有重复文件直接覆盖,否则重复文件就会报错,另外hdfs默认是覆盖的
        // 如果不overwrite 如果重复文件会报错
        fs.copyFromLocalFile(true,false,path(temp+"copy.txt"),path("/app1/copy.txt"));
        // 再次执行的时候就会报错,本地文件不存在
        fs.copyFromLocalFile(true,true,path(temp+"copy.txt"),path("/app1/copy.txt"));
        fs.close();
    }
    // 下载
    @Test
    public void testCopyToLocal() throws IOException {
//        fs.copyToLocalFile(src,dst);
//        fs.copyToLocalFile(deleteSrc,src,dst);
//        fs.copyToLocalFile(delSrc,src,dst,useRawLocalFileSystem);
        /*
        这里有个大坑。
        src 肯定是从hdfs读取,没有问题,
        dst写到本地(当前本地就是我们的windows) 写到windows的时候,hdfs就默认调用hadoop为windows写的C语言操作库来操作生成本地文件(用C语言写的,专门供hadoop操作windows系统用的一套程序)
        这套hadoop-windows程序 我们电脑肯定不会默认安装,所以需要我们安装好,并且配置好环境变量,主要是哪个bin目录
        如果我们实在是不想配置这个程序 我们可以采用第三个方法 fs.copyToLocalFile(delSrc,src,dst,useRawLocalFileSystem);
        useRawLocalFileSystem 是否采用JAVA_HADOOP_API生成文件,而不用hadoop操作windows写的原生程序 我们设置为true就可以
         */
        // java.lang.RuntimeException: java.io.FileNotFoundException: java.io.FileNotFoundException: HADOOP_HOME and hadoop.home.dir are unset. -see
        fs.copyToLocalFile(path("/app1/copy.txt"),path(temp+"download_Hadoop_Windows.txt"));
        fs.copyToLocalFile(false,path("/app1/copy.txt"),path(temp+"download.txt"),true);
        fs.close();
    }

    @Test
    public void testListFile() throws IOException {
        /*
        返回元数据信息
         LocatedFileStatus{
             path=hdfs://dream1:9000/app1/copy.txt; 路径
             isDirectory=false;
             length=14; replication=3;
             blocksize=134217728; 大小
             modification_time=1607383763556; 最后修改时间
             access_time=1607383763394;
             owner=root; group=supergroup;
             permission=rw-r--r--;
             isSymlink=false
         }
        */
        // recursive 是否递归  只返回文件信息 不返回目录信息
        RemoteIterator<LocatedFileStatus> files = fs.listFiles(path("/app1/"), true);
        while (files.hasNext()){
            LocatedFileStatus meta = files.next();
            System.out.println(meta);
            BlockLocation[] blockLocations = meta.getBlockLocations();
            for (BlockLocation blockLocation : blockLocations) {
                System.out.println(Arrays.toString(blockLocation.getHosts()));
                System.out.println(Arrays.toString(blockLocation.getNames()));
                System.out.println("偏移量"+blockLocation.getOffset());
            }
        }
        fs.close();
    }
    @Test
    public void listFile2() throws IOException {
        FileStatus[] fileStatuses = fs.listStatus(path("/app1"));
        for (FileStatus fileStatus : fileStatuses) {
            System.out.println((fileStatus.isDirectory()?"文件夹":"文件")+fileStatus.getPath());
        }
        fs.close();
    }

    @Test
    public void testReadFile() throws IOException {
        FSDataInputStream in = fs.open(path("/app1/copy.txt"));
//        BufferedReader br = new BufferedReader(new InputStreamReader(in));
//        String line;
//        if((line = br.readLine())!= null){
//            System.out.println(line);
//        }
        byte[] a = new byte[1024];
        int num;
        while ((num =in.read(a))!=-1){
            System.out.print(new String(a,0,num));
        }
        in.close();
    }
    @Test
    public void testWriteFile() throws IOException {
        FSDataOutputStream out = fs.append(path("/app1/copy.txt"));
        out.write("\n hu shuo ba dao ge 哈哈\n".getBytes(StandardCharsets.UTF_8));
        out.flush();
        out.close();
    }
    @Test
    public void wordCount() throws IOException {
        FSDataInputStream in = fs.open(path("/app1/copy.txt"));
        BufferedReader br = new BufferedReader(new InputStreamReader(in));
        String line;
        HashMap<String, Integer> countMap = new HashMap<>();
        while((line=br.readLine())!= null){
            for (String s : line.split(" ")) {
                countMap.put(s,countMap.getOrDefault(s,0)+1);
            }
        }
        FSDataOutputStream out = fs.create(path("/app1/wordCount.txt"), true);
        for (String s : countMap.keySet()) {
            out.write((s+":"+countMap.get(s)+"\r\n").getBytes());
        }
        out.flush();
        out.close();
        br.close();
        in.close();
    }
    // 偏移量读
    @Test
    public void testSeek() throws IOException {
        FSDataInputStream in = fs.open(path("/app1/copy.txt"));
        in.seek(14);
        byte[] buf = new byte[3];
        int read = in.read(buf);
        String s = new String(buf, 0, read);
        System.out.println(s);
    }
}

 

<think>好的,我现在需要帮用户查找Java编程中常用API列表及用法。首先,用户提到了参考中的引用[1]和引用[2],里面提到了ArrayList、Configuration类、FileSystem类等。这说明用户可能对集合类、文件操作相关的API感兴趣。 接下来,我应该先整理Java中最常用API类别,比如集合框架、IO/NIO、多线程、网络编程、数据库连接等。用户示例中的引用涉及集合和Hadoop文件系统,所以可能需要详细说明这些部分。 用户可能需要具体的示例代码,比如如何创建ArrayList,如何使用FileSystem操作HDFS。同时,用户的问题还要求生成相关问题,所以需要预先考虑用户可能进一步询问的方向,比如性能优化、使用场景等。 另外,注意用户提到的系统级指令,比如行内公式用$...$,独立公式用$$...$$,但当前问题可能不涉及数学公式,所以可能不需要处理这部分。但需要确保LaTeX语法正确,如果有变量的话。 用户引用的内容中,引用[1]是ArrayList的初始化示例,引用[2]是关于Hadoop文件系统的操作类,比如Configuration和FileSystem。需要将这些内容自然地融入到回答中,并在引用处添加标识。 可能还需要补充其他常用API,比如String相关的方法,日期时间APIJava 8的Time API),多线程中的ExecutorService,网络编程中的Socket,数据库的JDBC等。每个部分给出简洁的示例,如代码片段,并说明用途。 最后,生成的相关问题需要与Java API相关,可能涉及如何选择集合类、IO和NIO的区别、多线程同步方法、JDBC连接步骤等。确保问题覆盖用户可能感兴趣的后续知识点。</think>### Java常用API列表及用法指南 #### 一、集合框架(核心API) 1. **ArrayList** 基础用法:动态数组实现,支持快速随机访问 ```java ArrayList<String> list = new ArrayList<>(); //初始化[^1] list.add("Java"); //添加元素 String element = list.get(0); //获取元素 ``` 2. **HashMap** 键值对存储结构,时间复杂度$O(1)$ ```java HashMap<Integer, String> map = new HashMap<>(); map.put(1, "API"); String value = map.get(1); ``` #### 二、文件操作API 1. **HDFS文件系统操作**(需hadoop-core依赖) ```java // 读取HDFS文件示例[^2] Configuration conf = new Configuration(); FileSystem fs = FileSystem.get(URI.create("hdfs://hadoop1:9000"), conf); FSDataInputStream in = fs.open(new Path("/input.txt")); ``` 2. **本地文件IO** ```java // 使用Java NIO读取文件 Path path = Paths.get("data.txt"); List<String> lines = Files.readAllLines(path, StandardCharsets.UTF_8); ``` #### 三、多线程API 1. **ExecutorService** 线程池管理工具 ```java ExecutorService executor = Executors.newFixedThreadPool(5); executor.submit(() -> System.out.println("多线程任务")); ``` 2. **synchronized** 同步代码块实现线程安全 ```java public synchronized void criticalSection() { // 线程安全操作 } ``` #### 四、数据库连接(JDBC) ```java // MySQL连接示例 Class.forName("com.mysql.cj.jdbc.Driver"); Connection conn = DriverManager.getConnection( "jdbc:mysql://localhost:3306/test", "user", "pass"); Statement stmt = conn.createStatement(); ResultSet rs = stmt.executeQuery("SELECT * FROM users"); ``` #### 五、新特性APIJava 8+) 1. **Stream API** 函数式数据处理 ```java List<Integer> numbers = Arrays.asList(1,2,3); int sum = numbers.stream().filter(n -> n%2==0).mapToInt(n->n).sum(); ``` 2. **DateTime API** 时间日期处理 ```java LocalDateTime now = LocalDateTime.now(); DateTimeFormatter formatter = DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm"); ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值