首先要弄清楚涉及的文件层次结构:
1./user/hadoop,处于HDFS文件系统中,只能用以"hdfs dfs"的开头的Shell命令方式,相当于云网盘,本地上传的文件都存放在这里
2./home/hadoop,处于计算机文件系统中,只能用普通的liunx语言处理,云上下载的文件都存放在这里
3./usr/local/hadoop,个人文件夹,个人新建的文件存放地
几个注意点:
1.hadoop dfs 命令后面没有带参数,则默认是当前用户/user/hadoop目录
hadoop dfs -ls
2.liunx显示文件操作,英文符号.表示当前目录下
ls .
![]()
如图表示的是/usr/local/hadoop目录下
3.使用HDFS系统命令前要先进入/usr/local/hadoop启动hadoop
cd /usr/local/hadoop
./sbin/start-dfs.sh

实验内容和要求:
1.向HDFS中上传任意文本文件,如果指定的文件在HDFS中已经存在,由用户指定是追加到原有文件末尾还是覆盖原有的文件:
追加到末尾:~/a.txt 本地文件,text当前用户文件
hdfs dfs -appendToFile ~/a.txt text
覆盖原有文件:
hdfs dfs -put -f ~/a.txt text
2.从HDFS中下载指定文件,如果本地文件与要下载的文件名称相同,则自动对下载的文件重命名;
hdfs dfs -get test test.txt
3.将HDFS中指定文件的内容输出到终端中;
hdfs dfs -cat test.txt
4.显示HDFS中指定的文件的读写权限、大小、创建时间、路径等信息;
hdfs dfs -ls -h input/file.txt
5.给定HDFS中某一个目录,输出该目录下的所有文件的读写权限、大小、创建时间、路径等信息,如果该文件是目录,则递归输出该目录下所有文件相关信息;
hdfs dfs -ls -R -h /user/hadoop
6.提供一个HDFS内的文件的路径,对该文件进行创建和删除操作。如果文件所在目录不存在,则自动创建目录;
hdfs dfs -mkdir -p /output
7.提供一个HDFS的目录的路径,对该目录进行创建和删除操作。创建目录时,如果目录文件所在目录不存在则自动创建相应目录;删除目录时,由用户指定当该目录不为空时是否还删除该目录;
创建:
hdfs dfs -mkdir -p /output/out
询问删除:
hdfs dfs -rmdir /output
直接删除:
hdfs dfs -rm -r /output
8.删除HDFS中指定的文件;
hdfs dfs -rm ./test
9.在HDFS中,将文件从源路径移动到目的路径。
hdfs dfs -mv ./test2.txt /test.txt

本文主要介绍了HDFS的基础操作,包括文件层次结构的理解,如/user/hadoop、/home/hadoop和/usr/local/hadoop的用途。重点讲解了hadoop dfs命令的使用,如上传、下载文件,查看文件权限、大小、创建时间等信息,以及目录操作,包括创建、删除和移动文件及目录。此外,还提到了文件追加和覆盖选项,以及在文件冲突时的处理策略。
626

被折叠的 条评论
为什么被折叠?



