2.2 Modifying Text with RegularExpressions
替换(substitution),也可以叫“查找和替换(search and replace)”。
其形态如下:
$var =~ s/regex/replacement/
注 替换表达式之前的“s”不可以像查找表达式($var =~ /regex/)那样省略表达式之前的“m”!
2.2.1 Example: Form Letter
替换“=…=”部分。
代码如下:
#! /usr/bin/perl -w
# Mastering Regular Expressiona: Chapter 2 Section 2.
# third program
$letter = "Dear =FIRST=,
You have been chosen to win a brand new =TRINKET=! Free!
Could you use another =TRINKET= in the =FAMILY= household?
Yes =SUCKER=, I bet you could! Just respond by......";
$given = "Tom";
$family = "Cruise";
$wunderprize = "100% genuine faux diamond";
$letter =~ s/=FIRST=/$given/g;
$letter =~ s/=FAMILY=/$family/g;
$letter =~ s/=SUCKER=/$given $family/g;
$letter =~ s/=TRINKET=/fabulous $wunderprize/g;
print $letter;
/g修饰符:“全局替换(global replacement)”
2.2.2 Example: Prettifying aStock Price
保留小数点后两位数字,如果第三位不为零,也需要保留,去掉其他的数字。
$price =~ s/(\.\d\d[1-9]?)\d*/$1/
「\.」匹配小数点
「\d\d」匹配小数点后的两位数字
「[1-9]?」匹配可能跟在后面的非零数字
把这些保存到$1变量中。
把剩余的数字使用「\d*」匹配。
2.2.3 Automated Editing
在2.2.1例子中我们把整个文本放在变量$letter中,能不能有一种方法把这个文本放在文件中,然后用命令替换呢?答案是肯定的。
如下所示:
$perl -p -i -e 's/=FIRST=/Tom/g' formLetter1
参数-p表示对目标文件的每一行进行查找和替换;
参数-i表示将替换的结果写回到文件;
参数-e表示整个程序接在命令的后面;
2.2.4 A Small Mail Utility
检查表示邮件header结束的空行。
/^\s*$/
^: 行开头
\s*: 任意数目的空白字符
$: 行结尾
套用在主题上(Subject),就是:
/^Subject: (.*)/i
「.*」:“一组任何字符”(a bunch of anything)
Date和Reply-To的处理类似。
只有From:与它们不同。
例如:
From: veic_2005@163.com(The Bin)
它包含了邮件的发送地址,发送者的姓名
不包括发送者姓名的:「^From:(\S+)」
包括发送者姓名的:「^From:(\S+) \(([^()]*)\)」
带下划线的表示转义的符号。
字符组内表示的是,非“(”和“)”。
如下图解释:
