很多时候
我们
想从一段
html
中找到需要的。
比如有一段html
Code
<!--
Code highlighting produced by Actipro CodeHighlighter (freeware)
http://www.CodeHighlighter.com/
-->some do<div class ="postTitle"><a id="homepage1_HomePageDays_DaysList_ctl01_DayItem_DayList_ctl02_TitleUrl" class="postTitle2" href="http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html">把一个sql where表达式转化为一个二叉树</a>ddd<div>1 <div >2</div></div></div><br />如题。比如我们有一个sql<br />select a.id from b ,c<br />where<br /> (b.id=c.id) and ((b.code='a' and c.code='d') or b.name='c' )<br /><br />将 where 后面的表达式转化为二叉树.<br /><br /><br />:( 俺也不会<br />有空研究研究<div class = "postDesc">posted @ <a href="http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html" Title = "permalink">2009-09-28 17:02</a> netfuns 阅读(45) | <a href="http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html#FeedBack" Title = "comments, pingbacks, trackbacks">评论 (0)</a> | <a href="http://www.cnblogs.com/netfuns/admin/EditPosts.aspx?postid=1575829">编辑</a>
<div id=level1>level1
<div id=level2>level2
<div>level3</div>
<div/>
</div>
</div> some end
正则1:<div class ="postTitle">(?<name>[\s\S]+?)</div>
结果为
<div class ="postTitle">dddd<a id="homepage1_HomePageDays_DaysList_ctl01_DayItem_DayList_ctl02_TitleUrl" class="postTitle2" href="<A" target="_blank" rel="nofollow">http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html">把一个sql where表达式转化为一个二叉树</a>ddd<div>1 <div >2</div>
说明不能嵌套。但对于简单的标记是 可以 了。
正则2 :
<div class ="postTitle">(?<mycontent>[\s\S]+)</div>
结果:
得到整个div,包括嵌套的 内容 .
说明对于嵌套的html标记内容提取是可以的
比如有一段html


<!--
Code highlighting produced by Actipro CodeHighlighter (freeware)
http://www.CodeHighlighter.com/
-->some do<div class ="postTitle"><a id="homepage1_HomePageDays_DaysList_ctl01_DayItem_DayList_ctl02_TitleUrl" class="postTitle2" href="http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html">把一个sql where表达式转化为一个二叉树</a>ddd<div>1 <div >2</div></div></div><br />如题。比如我们有一个sql<br />select a.id from b ,c<br />where<br /> (b.id=c.id) and ((b.code='a' and c.code='d') or b.name='c' )<br /><br />将 where 后面的表达式转化为二叉树.<br /><br /><br />:( 俺也不会<br />有空研究研究<div class = "postDesc">posted @ <a href="http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html" Title = "permalink">2009-09-28 17:02</a> netfuns 阅读(45) | <a href="http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html#FeedBack" Title = "comments, pingbacks, trackbacks">评论 (0)</a> | <a href="http://www.cnblogs.com/netfuns/admin/EditPosts.aspx?postid=1575829">编辑</a>
<div id=level1>level1
<div id=level2>level2
<div>level3</div>
<div/>
</div>
</div> some end
正则1:<div class ="postTitle">(?<name>[\s\S]+?)</div>
结果为
<div class ="postTitle">dddd<a id="homepage1_HomePageDays_DaysList_ctl01_DayItem_DayList_ctl02_TitleUrl" class="postTitle2" href="<A" target="_blank" rel="nofollow">http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html">把一个sql where表达式转化为一个二叉树</a>ddd<div>1 <div >2</div>
说明不能嵌套。但对于简单的标记是 可以 了。
正则2 :
<div class ="postTitle">(?<mycontent>[\s\S]+)</div>
结果:
得到整个div,包括嵌套的 内容 .
说明对于嵌套的html标记内容提取是可以的