六周第三次课(1月17日)
9.6/9.7 awk

awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。awk有3个不同版本: awk、nawk和gawk,未作特别说明,一般指gawk,gawk 是 AWK 的 GNU 版本。awk其名称得自于它的创始人 Alfred Aho 、Peter Weinberger 和 Brian Kernighan 姓氏的首个字母。实际上 AWK 的确拥有自己的语言: AWK 程序设计语言 , 三位创建者已将它正式定义为“样式扫描和处理语言”。它允许您创建简短的程序,这些程序读取输入文件、为数据排序、处理数据、对输入执行计算以及生成报表,还有无数其他的功能。


blob.png

blob.png


awk -F ":" "{print $1}" test.txt 指定分割f为: 把第一段打印出来

blob.png

$0表示所有的段

blob.png

打印所有的段 相当于cat

blob.png

不指定分割f,默认以空格或空白为分割进行打印

blob.png

指定分割f,打印多段

blob.png

指定中间以什么为分割

blob.png

blob.png

把包含oo的打印出来 awk "/oo/"

blob.png

匹配第一段包含oo的行

blob.png

适用正则表达式     且不用加脱义字符

blob.png

支持多个表达式一起写

blob.png

blob.png

blob.png

打印第三段等于0的行   要写2个=,写1个=是赋值,不写print默认是print $0

blob.png


打印大于等于1000的

blob.png

加上双引号,以ASCII码计算,会认为这是一个字符串  需求如果是针对数字的不要加双引号

blob.png

第七段不等于!=   字符串要加上双引号

blob.png

比较2个字段 第三段小于第四段  相等的行   

blob.png

多个判断一起   $3>5并且$3<7

blob.png

blob.png

blob.png

-F指定分割前的分割f,OFS=指定print时分割后用到的分割f

blob.png

 blob.png

blob.png

NR 表示行 类似grep -n  NF表示段

blob.png blob.png

NR作为判断条件

blob.png

blob.png

NF作为判断条件

blob.png

$1$7到$30$7   $NF指最后一段

blob.png

$1=root  赋值,以:分割打印,赋值为root,赋值之后分割f没了,使用OFS定义分割F

blob.png

blob.png

求和第三段所有值的和

blob.png




扩展

把这里面的所有练习题做一下
spacer.gifhttp://www.apelearn.com/study_v2/chapter14.html