正则表达式中使用问号可以取消贪婪模式

正则表达式中使用问号可以取消贪婪模式

使用正则表达式抽取整个页面的特定内容是非常方便的,但在使用时有一些细节问题还是很关键的,比如合理的使用问号(?)可以取消贪婪的抽取问题。

比如页面中包含有很多段<p>…</p>,如果我们使用下面的方法抽取:

1
2
Regex rx = new Regex( "<p>(.*)</p>" );
Match match = rx.Match(str); // match.NextMatch(); 可用来取下一个

结果是只提出一个,内容是从第一个<p>开始到最后一个</p>结束。

这里我们只要加上问号,如下代码:

1
2
Regex rx = new Regex( "<p>(.*?)</p>" );
Match match = rx.Match(str);

这时提到出来的就是一个个独立的<p>…</p>,有时这才是我们想要的。

另外上面正则表达式里的括号也很有用,使用match.Group[0]得到匹配的结果,用match.Group[1]即得到括号中的内容。有多个括号按从外到内、从左到右的原则依次从Group里取。

PS. C#中还有个Group的概念,挺鬼异的,这里有解释,抽空研究一下:http://blog.youkuaiyun.com/zhoufoxcn/archive/2010/03/09/5358644.aspx

Updated:更多正则表达式的揭密参见这里:http://www.regexlab.com/zh/regref.htm

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值