正则表达式实用技巧与高效表达式构建
1. 匹配特定 ZIP 代码
在处理 ZIP 代码匹配时,有一个表达式 !(?:[ˆ4]\d\d\d\d<\d[ˆ4]\d\d\d)+˙˙˙ ,它会在达到所需代码或没有更多代码时结束匹配。而 !(44\d\d\d)?" 可以匹配所需的 ZIP 代码,如果代码不存在也不会强制回溯。不过,这种解决方案存在问题,因为即使没有目标 ZIP 代码,正则表达式也可能匹配,所以处理代码会更复杂。但它的优点是速度快,因为涉及的回溯和传输的推进操作较少。
为了保持与数据的同步,可以在任何方法的表达式前加上 !\G" 。以第二个表达式为例,最终得到:
@zips = m/\G(?:(?!44)\d\d\d\d\d)+(44\d\d\d)/g;
这样就无需进行特殊的匹配后检查。
实际上,也可以使用 !\d\d\d\d\d" 抓取每个 ZIP 代码,然后丢弃不以 44 开头的代码。在 Perl 中的实现如下:
@zips = ( ); # 确保数组为空
while (m/(\d\d\d\d\d)/g) {
$zip = $1;
if (substr($zip, 0, 2) eq "44") {
push @zips, $zip;
}
}
超级会员免费看
订阅专栏 解锁全文
10万+

被折叠的 条评论
为什么被折叠?



