Perl正则表达式与CPAN模块的高级应用
1. 反向引用(Backreferences)
在处理数据时,我们常常需要从接收到的数据中提取特定信息,反向引用就是一种高级方法。反向引用是正则表达式中括号内匹配的子字符串。下面通过一个例子来理解:假设我们有一个包含大量英文单词的文件,每行一个单词,如何编写正则表达式来搜索包含三个连续相同字母的单词呢?
在正则表达式解释器中,括号内匹配的内容会被存储为变量。在Perl中,可以用简单的数字来访问这些变量, \1 表示第一个括号内的匹配项, \2 表示第二个,依此类推。以下是一个示例代码,用于在字典文件中匹配这些特殊单词:
#!/usr/bin/perl -w
use strict;
open(DICT,"<","words.txt");
while(<DICT>){
print if(m/([a-z])\1\1/);
}
在上述代码中,当逐行读取文件时,如果某行包含一个小写字母,且该字母连续出现三次,就会将该行打印出来。运行这个脚本,会得到类似如下的结果:
[trevelyn@shell ~/pentestwithperl/dev]$ perl backrefword.pl
crosssection
crosssubsidize
shellless
bossship
demigoddessship
goddessship
headmistressship
patroness
超级会员免费看
订阅专栏 解锁全文
456

被折叠的 条评论
为什么被折叠?



