简介
grep,sed,awk被称为Linux文本处理的三剑客,各有特点
grep:适合文本的匹配和查找
sed:编辑匹配到的文本
awk:对文本进行格式化输出
awk简介
awk的基本语法是
awk [options] 'Pattern {Actions}' file1,file2...
Actions指的是工作,awk擅长文本输出,最常用的动作是print和printf
场景一:简单输出文本
$ touch awk.cc
$ echo "ddd" > awk.cc
$ awk '{print}' awk.cc
ddd
场景二:格式的输出某一列数据
上图中,首先将df的结果通过管道传给了awk,awk输出了第五列的数据,$5表示第五个。
awk工作原理
awk会逐行获取数据,然后对每一行进行处理,将一行中的数据按照“分隔符”分割成多个单次,并依次以1,1,2,3…等变量标记这些单词。用户可以指定分隔符,如果不指定的话,默认使用空格作为单词之间的分隔符。awk内置变量,3…等变量标记这些单词。用户可以指定分隔符,如果不指定的话,默认使用空格作为单词之间的分隔符。awk内置变量,0表示整行,NF表示一行中的最后一个变量(单词)。还可以使用NF表示一行中的最后一个变量(单词)。还可以使用(NF-1)表示倒数第一个变量。
其他输出形式
记住一点,awk中的单词都是以变量的形式存在
- 输出多列,变量以逗号隔开
# df | awk '{print $1,$NF}'
- 输出自定义变量
# df | awk '{print $1,$NF,"string"}'
需要注意的是,将$标识的变量和我们传入的变量分清楚就好了
awk的模式
再次重申awk的语法
awk [options] 'Pattern {Actions}' file1,file2...
这里我们再来说awk的模式,awk有很多模式,先说两个特殊的模式,BEGIN和END
BEGIN标识,在处理awk的操作之前,先要执行的操作,END标识,在执行完毕之后,再要执行的操作
BEGIN模式处理的一个优点就是,在格式化显示文本之前,给每一列做一个标识,BEGIN就是执行awk之前先要进行的操作。
注意:多个操作强调内容一定要在单引号内(”),要有花括号分割({})