对字符串及其有效的几种工具。
awk,grep以及sed。
awk可以将字符串按指定的字符隔开。
grep可以过滤想要的行。
sed可以替换字符串中指定的字符。
awk:
比如我查询了hive仓库下的一个表文件:
-rw-r----- 3 user hadoop 1476844 2016-10-01 11:52 /user/hive/warehouse/database.db/table/dt=20161001/part-m-00000
然后我需要根据这条语句判断这个表是否有数据量,显然我需要获取1476844这个字段,这个时候就可以使用awk。
通过管道awk 'BEGIN{FS=" "} {print $5}',即可获得对应位置的数字。
grep:
筛选想要的行。
假如test.txt中有如下文字:
name string,
id integer,
age integer,
address string
使用grep -e 'string' ./test.txt 命令即可筛选出包含string的行。
sed:
替换字符串中指定字符。
假如一个文件中有内容:name,id,age,addree。
使用管道sed 's/,/?/g'`即可将,换为?
本文介绍了三种强大的文本处理工具:awk、grep和sed。awk用于按指定字符分割字符串并提取所需字段;grep用于从文件中筛选出包含特定字符串的行;sed则用于替换字符串中的指定字符。
1058

被折叠的 条评论
为什么被折叠?



