7、Awk正则表达式与输入处理全解析

Awk正则表达式与输入处理全解析

1. 正则表达式匹配文本的长度

在处理正则表达式时,了解匹配文本的长度至关重要。例如,执行以下命令:

echo aaaabcd | awk '{ sub(/a+/, "<A>"); print }'

此例运用 sub() 函数对输入记录进行修改。 sub() 函数会将第一个参数匹配到的首个文本实例替换为第二个参数提供的字符串。这里,正则表达式 /a+/ 表示“一个或多个 a 字符”,替换文本为 <A> 。输入包含四个 a 字符,awk 以及 POSIX 正则表达式总会匹配输入字符中最左侧、最长的可匹配序列。所以在这个例子中,四个 a 字符都被替换成了 <A> ,结果如下:

<A>bcd

对于简单的匹配/不匹配测试,这或许不太重要。但在使用 match() sub() gsub() gensub() 函数进行文本匹配和替换时,就十分关键了。理解这一原则对于基于正则表达式的记录和字段分割也很重要。

2. 使用动态正则表达式

~

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值