-- Start
假设让你在一个文件中查找一下 u 后面不是 x 的单词,怎么办? 一个很自然的想法是用下面的正则表达式来查找:
u[^x]
不过遗憾的是,你很可能漏掉了部分单词,啊? 是吗? 我怎么没看出问题来呢? 到底会漏掉什么样的单词呢? 呵呵,如果 you 这个单词出现在一行的末尾,试一试,你还能用这个表达式搜索出来吗? 记住排除型字符组的意思是匹配一个未列出的字符,而不是不要匹配列出的字符。
那么正确的做法是什么呢? 试一试下面的表达式吧。
u(?!x)
这个表达式是什么意思呢?它的意思是匹配字母 u, 且 u 的右边不是 x。那我想查找 u 后面是 x 的单词该怎么办呢?试一试下面的表达式吧:
u(?=x)
那我想查找 u 前面是 x 的单词该怎么办呢?试一试下面的表达式吧:
(?<=x)u
那我想查找 u 前面不是 x 的单词该怎么办呢?试一试下面的表达式吧:
(?<!x)u
呵呵,是不是有点糊涂啊。再看一遍。我们把这四个元字符称为环视(lookaround),它们和我们之前学过的单词分界符,行的起始和结束符一样,它们只匹配位置,而不匹配具体的字符,了解这一点很重要。恭喜你,你又学会了四个非常强悍的正则表达式元字符。
元字符 名称 匹配对象 . 点号(dot) 单个任意字符 [...] 字符组(Character Class) 列出的任意字符 [^...] 排除型字符组(Negated Character Class) 未列出的任意字符 ^ 脱字符(caret) 行的起始位置 $ 美元符(dollar) 行的结束位置 \< 单词的起始位置 \> 单词的结束位置 \b Boundary 单词边界 \B 非单词边界 (?=...) 肯定顺序环视(Positive Lookahead) 成功如果右边能够匹配 (?!...) 否定顺序环视(Negative Lookahead) 成功如果右边不能够匹配 (?<=...) 肯定逆序环视(Positive Lookbehind) 成功如果左边能够匹配 (?<!...) 否定逆序环视(Negative Lookbehind) 成功如果左边不能够匹配 | 竖线(bar) 匹配分割两边的任意一个表达式
---更多参见:正则表达式精萃
-- 声 明:转载请注明出处
-- Last Updated on 2012-05-12
-- Written by ShangBo on 2012-04-21
-- End