测试hadoop fs -count 返回前2个数值的意思
[root@hadoop101 software]# hadoop fs -ls -R /tmp/test
drwxr-xr-x - root supergroup 0 2022-03-09 11:11 /tmp/test/software
-rw-r--r-- 2 root supergroup 209419991 2022-03-09 11:11 /tmp/test/software/spark-3.2.0-bin-without-hadoop.tgz
[root@hadoop101 software]# hadoop fs -du -h /tmp/test
199.7 M /tmp/test/software
[root@hadoop101 software]# hadoop fs -du -h /tmp/test/*
199.7 M /tmp/test/software/spark-3.2.0-bin-without-hadoop.tgz
[root@hadoop101 software]# hadoop fs -count /tmp/test/*
1 1 209419991 /tmp/test/software
[root@hadoop101 software]# hadoop fs -count /tmp/test/
2 1 209419991 /tmp/test
[root@hadoop101 software]#
分析及结论: block的大小是128M,200M的文件,总共有2个block, 返回第二个参数是1,所以代表文件数。

结论:第一个是目录数,第二个是文件数,不是block数。
本文详细解读了hadoopfs-count命令在计算文件和目录数量时的返回值,指出第一个参数是目录数,第二个是文件数,并通过实例说明了如何根据block大小推断文件块分布情况。
3874

被折叠的 条评论
为什么被折叠?



