Awk编程深入解析:规则、语句与控制流
1. END规则中的变量特性
在END规则里,标准规定NF变量是可用的,它包含最后一个输入记录的字段数量。不过,标准未提及$0也会被保留,尽管从逻辑上看应该如此。实际上,BWK awk、mawk和gawk都会保留$0的值供END规则使用,但其他一些实现和许多旧版本的Unix awk则不会。
在BEGIN或END规则中, print 的含义始终是 print $0 。若$0为空字符串,就会打印一个空记录。很多有经验的awk程序员会在BEGIN和END规则中使用无修饰的 print 来表示 print "" ,这依赖于$0为空。虽然在BEGIN规则中这样做通常没问题,但在END规则中,至少在gawk里,这是个糟糕的做法,而且代码风格也不佳。如果输出需要空行,程序应明确打印。
另外, next 和 nextfile 语句在BEGIN规则中是不允许的,因为隐式的读取记录并匹配规则的循环尚未开始;同样,在END规则中这些语句也无效,因为所有输入都已读取完毕。
2. BEGINFILE和ENDFILE特殊模式
这是gawk特有的功能。BEGINFILE和ENDFILE这两种特殊规则,为gawk的命令行文件处理循环提供了“钩子”。就像BEGIN和END规则一样,程序中所有的BEGINFILE规则会按gawk读取的顺序合并,所有的ENDFILE规则也会合并。
BEGINFILE规则的主体在gawk读取文件的第一条记录
超级会员免费看
订阅专栏 解锁全文
6

被折叠的 条评论
为什么被折叠?



