注意:shell中的字符串拼接是不需要用+号的,直接在字符串后面继续添加即可。如:${file}-`date +%s`.ok,最后出来的就是file名字+日期+.ok
1.批量去除.ok后缀的文件名,使用表达式${string%substring}
| for file in `hdfs dfs -find $1 -name "*.ok"` |
2.测试文件夹的大小,result包含几个值,用空格分开,只有第一个是文件夹的大小。首先将空格用AAA代替,表达式:${result// /AAA}。然后取出第一个AAA的index,表达式:expr index ${result_rep} AAA。最后再截取字符串,表达式:expr substr ${result_rep} 1 ${index}
| result=`hdfs dfs -du -s /user/hive/warehouse/splited_tmp_split` |
参考:linux shell 字符串操作详解 (长度,读取,替换,截取,连接,对比,删除,位置 )
本文介绍如何利用Shell脚本批量处理HDFS上的文件,包括去除文件名后缀及测试文件夹大小的方法。文章详细展示了具体的Shell命令与字符串操作技巧。

499

被折叠的 条评论
为什么被折叠?



