HDFS 是分布式文件系统
HDFS的Shell 操作
>ls bin #所有的命令都在hdfs下
>bin/hdfs #要求再输入command(命令)
>bin/hdfs dfs #hadoop fs这里是hadoop1中的命令,文档一直没有修改
>bin/hdfs dfs -help ls #查看 -d(目录) -h(格式化文件的) -R(递归)
>bin/hdfs dfs -ls
HDFS路径的写法:
1》配置路径中配置的信息
hdfs://192.168.22.2:9000,这里的hdfs 是一种访问协议 类似http://www.baidu.com:80(默认端口)
hdfs dfs -ls hdfs:192.168.22.2:9000 /
这种写法适用多个集群使用
2》直接/
hdfs dfs -ls /
这种适用默认集群(当集群中只有一个)
3》直接写. 或者.. 或者目录名
hdfs dfs -ls a
这种是非根目录下查看,需要指定特定目录下的
>ls / # 根目录下信息
>ls . #当前目录信息
创建文件夹
>bin/hdfs dfs -mkdir /dir1 #创建文件夹
>bin/hdfs dfs -ls / #查看是否创建成功
>bin/hdfs dfs -mkdir -p /dir1/dir11/dir111 #加上 -p 可用递归创建他的父路径
>bin/hdfs dfs -help mkdir #查看某个命令的帮助文档
>bin/hdfs dfs -ls -R / #递归显示
>bin/hdfs dfs -ls -R /dir1 #查看dir1目录下的信息
>bin/hdfs dfs -ls -R / |more # |more-->管道more 表示分页显示
存储文件到hdfs
>bin/hdfs dfs -put /usr/hadoop1.7.5/hadoop.zip /dir
# -put 表示上传到hdfs ,第一个参数是被上传本地位置文件,第二个是hdfs所在位置
>hdfs dfs -put hadoop-2.7.5.tar.gz /dir1
下载文件到本地
>bin/hdfs dfs -get /dir1/hadoop-2.7* .
# -get 表示下载 第一个参数是hdfs文件所在位置,第二个参数 .表示当前路径
>hdfs dfs -get /dir1/hadoop-* ./111
查看hdfs文件
>bin/hdfs dfs -text /dir1/hadoop-*
>bin/hdfs dfs -text /dir1/hadoop-* |more # |more 管道分页查看
删除hdfs文件
>bin/hdfs dfs #查看dfs命令下的 所有操作命令
>bin/hdfs dfs -rm -r /dir1 #删除目录
>bin/hdfs dfs -rm -f /dir1/1.txt #删除文件