很多人都会为去除HTML中的标记显示纯文本而苦恼,现在你可以用正则表达式来实现,我设计了一个"/<//?(["=:_/. ]|/w)+//?/>"我在编很多项目时通过它去除HTML中的标记显示纯文本很好用的。
string ss = "<li><a id=/"ctl00_TopNavBar_ArtPostArticle/" class=/"fly/" href="/" mce_href="/""/info/Submit.aspx/">Post an Article</a></li>"; Regex regex = new Regex("//<///?([/"=:_/. ]|//w)+///?//>"); Response.Write(String.Format("<b>Before:</b>{0}",ss)); // HTML 文本 Response.Write("<br/>"); ss = regex.Replace(ss, String.Empty); Response.Write(String.Format("<b>After:</b>{0}", ss));// 输出为纯文本
大家试试效果,不错的。输出Post an Article
本文介绍了一种使用正则表达式去除HTML标记的方法,该方法能够有效提取纯文本内容。通过示例代码展示了如何利用正则表达式过滤HTML标签,从而得到纯净的文本信息。
3373

被折叠的 条评论
为什么被折叠?



