Awk编程深入解析:规则、语句与控制流
1. 规则中的特殊情况
在awk编程里,有一些特殊规则需要我们注意。标准规定在END规则中可以使用NF,它代表最后一条输入记录的字段数量。不过,标准未明确提及$0也会被保留,然而从逻辑上推测它应该被保留。实际上,BWK awk、mawk和gawk都保留了$0的值供END规则使用,但其他一些实现和许多旧版Unix awk则不会。
在BEGIN或END规则里,“print”的含义始终是“print $0”。要是$0为空字符串,就会打印出一条空记录。很多有经验的awk程序员在BEGIN和END规则中使用无参数的“print”来表示“print “””,这是基于$0为空的假设。虽然在BEGIN规则中这样做通常没问题,但在END规则中,至少在gawk里,这是个糟糕的做法,而且代码风格也不佳。如果输出需要空行,程序应该明确打印出来。
另外,next和nextfile语句在BEGIN规则中是不被允许的,因为隐式的读取记录并匹配规则的循环还未启动。同样,在END规则中这些语句也无效,因为所有输入都已读取完毕。
2. BEGINFILE和ENDFILE特殊模式
这是gawk特有的功能。BEGINFILE和ENDFILE这两种特殊规则,为我们提供了介入gawk命令行文件处理循环的“钩子”。就像BEGIN和END规则一样,程序中的所有BEGINFILE规则会按gawk读取的顺序合并,所有ENDFILE规则也会合并。
BEGINFILE规则的主体会在gawk读取文件的第一条记录之前执行。此时,FILENAME会被设置为当前文件的名称,FNR会被设置为零。这个规则让我们能够完成两项原本困难或无法完成的任
超级会员免费看
订阅专栏 解锁全文
5

被折叠的 条评论
为什么被折叠?



