环境:Hadoop1.2.1
例:直接使用FileSystem以标准输出格式显示Hadoop文件系统中的文件
编写JAVA文件
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;
import java.io.InputStream;
import java.net.URI;
public class FileSystemCat {
public static void main(String[] args) throws Exception {
String uri = args[0];
Configuration conf = new Configuration();
FileSystem fs = FileSystem.get(URI.create(uri), conf);
InputStream in = null;
try {
in = fs.open(new Path(uri));
IOUtils.copyBytes(in, System.out, 4096, false);
} finally {
IOUtils.closeStream(in);
}
}
}
设置JAVA_HOME环境变量,将$JAVA_HOME/bin添加到PATH环境变量
设置Hadoop的类目录( HADOOP_CLASSPATH)
[grid@hadoop1 hadoop-1.2.1]# vi conf/hadoop-env.sh
# The java implementation to use. Required.
export JAVA_HOME=/usr/java/jdk1.7.0_72
# Extra Java CLASSPATH elements. Optional.
export HADOOP_CLASSPATH=/home/grid/hadoop-1.2.1/myclasses
上传编辑好的JAVA文件
[grid@hadoop1 hadoop-1.2.1]$ mkdir myclasses
[grid@hadoop1 hadoop-1.2.1]$ cd myclasses
[grid@hadoop1 myclasses]$ rz
编译java文件
[grid@hadoop1 myclasses]$ javac -classpath ../hadoop-core-1.2.1.jar FileSystemCat.java
执行: 了解更多
[grid@hadoop1 hadoop-1.2.1]$ ./bin/hadoop FileSystemCat hdfs://hadoop1:9000/user/grid/in/test3.txt
Hello Hadoop Java API

本文介绍如何在Hadoop1.2.1环境下使用Java API进行文件系统操作,包括配置环境变量、编译和执行Java文件的具体步骤。通过示例代码展示如何读取Hadoop文件系统中的文件。
2889

被折叠的 条评论
为什么被折叠?



