Jar包准备
准备Hadoop的Jar包,这里准备的是Linux(64)环境下hadoop2.7.2的打包文件hadoop-2.7.2.tar.gz
1.将其下载解压到非中文目录
2.进入share文件夹,找到其中所有jar包,并将jar包拷贝到_lib文件夹(自己创建,任意起名)中
3.在全部jar包中查找结尾为sources.jar的jar包,并剪切到_source文件夹中(无用,可保留)
4.在全部jar包中查找结尾为tests.jar的jar包,并剪切到_test文件夹中(无用,可保留)
Eclipse准备
根据自己电脑的操作系统拷贝对应的编译后的hadoop jar包到非中文路径下,
jar包下载
win7
和
win10
,其中win10与win7的不同只在于解压后的bin目录,所以win10用户需要win7包下载保留并将win10包内容覆盖到win7包的bin目录即可
1.将下载的文件解压到非中文目录(例如:D:\software\hadoop-2.7.2)
2.配置HADOOP_HOME环境变量

3.启动Eclipse并创建一个Java Project
4.创建lib文件夹,然后添加之前准备好的_lib文件夹中的jar包(不要忘记Build Path)

5.创建包名:com.lzl.hdfs
6.创建HdfsClient类
public class HdfsClient {
// 上传文件
public static void main(String[] args) throws IOException, InterruptedException, URISyntaxException {
// 1 获取文件系统
Configuration configuration = new Configuration();
// 配置在集群上运行
// configuration.set("fs.defaultFS", "hdfs访问路径");
// FileSystem fs = FileSystem.get(configuration);
FileSystem fs = FileSystem.get(new URI("hdfs访问路径"), configuration, "用户名");
// 2 上传文件
fs.copyFromLocalFile(new Path("e:/hello.txt"), new Path("/hello2.txt"));
// 3 关闭资源
fs.close();
System.out.println("over");
}
}
7.执行程序
运行程序时需要配置Hadoop用户名称
客户端去操作hdfs时,是有一个用户身份的。默认情况下,hdfs客户端api会从jvm中获取一个参数来作为自己的用户身份:
-DHADOOP_USER_NAME=hadoop,hadoop为用户名称
8.显示输出日志
在项目的src目录下,新建一个文件,命名为“log4j.properties”,在文件中填入:
log4j.rootLogger=INFO, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n
log4j.appender.logfile=org.apache.log4j.FileAppender
log4j.appender.logfile.File=target/spring.log
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n