Awk与文件操作实用指南
1. Awk字符串处理函数
在文本处理中,Awk提供了丰富的字符串处理函数,这些函数能帮助我们高效地完成各种任务。
1.1 字符串替换
在数据处理时,替换操作往往比索引和子字符串操作更适合用于数据缩减。例如,要从类似 composer = "P. D. Q. Bach" 这样的赋值语句中提取字符串值,使用替换操作会更方便。
value = $0
sub(/^ *[a-z]+ *= *"/, "", value)
sub(/" *$/, "", value)
而使用索引操作的代码如下:
start = index($0, "\"") + 1
end = start - 1 + index(substr($0, start), "\"")
value = substr($0, start, end - start)
可以看出,索引操作需要更仔细地计算字符位置,对数据模式的匹配不够精确,还需要创建两个子字符串。
1.2 字符串分割
Awk自动为当前输入记录 $0 提供了方便的字段分割功能,将其分割为 $1 、 $2 等字段,同时也提供了 split() 函数来实现相同的功能。
split(string, array,
超级会员免费看
订阅专栏 解锁全文
29

被折叠的 条评论
为什么被折叠?



