去除HTML中的标记显示纯文本

最新推荐文章于 2022-10-31 13:13:40 发布

最新推荐文章于 2022-10-31 13:13:40 发布 · 232 阅读

本文介绍了一种使用正则表达式去除HTML标记的方法，该方法能够有效提取纯文本内容。通过示例代码展示了如何利用正则表达式过滤HTML标签，从而得到纯净的文本信息。

很多人都会为去除HTML中的标记显示纯文本而苦恼，现在你可以用正则表达式来实现，我设计了一个"/<//?(["=:_/. ]|/w)+//?/>"我在编很多项目时通过它去除HTML中的标记显示纯文本很好用的。

string ss = "<li><a id=/"ctl00_TopNavBar_ArtPostArticle/" class=/"fly/" href="/" mce_href="/""/info/Submit.aspx/">Post an Article</a></li>"; Regex regex = new Regex("//<///?([/"=:_/. ]|//w)+///?//>"); Response.Write(String.Format("<b>Before:</b>{0}",ss)); // HTML 文本 Response.Write("<br/>"); ss = regex.Replace(ss, String.Empty); Response.Write(String.Format("<b>After:</b>{0}", ss));// 输出为纯文本

大家试试效果，不错的。输出Post an Article