调用下面的方法屏蔽所有html标签提取文本

本文介绍了一个用于移除字符串中HTML标签和特殊字符的C#方法。该方法通过正则表达式来清理HTML标签、脚本、注释及特殊字符实体等,确保输出的文本干净且安全。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

public  static  string  NoHTML( string  Htmlstring) //替换HTML标记
   {
   string  pattern = "http://([^\\s]+)\".+?span.+?\\[(.+?)\\].+?>(.+?)<" ;
   Regex reg = new  Regex(pattern, RegexOptions.IgnoreCase);
   //删除脚本
   Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>" , "" , RegexOptions.IgnoreCase);
   //删除HTML
   Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>" , "" , RegexOptions.IgnoreCase);
   Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+" , "" , RegexOptions.IgnoreCase);
   Htmlstring = Regex.Replace(Htmlstring, @"-->" , "" , RegexOptions.IgnoreCase);
   Htmlstring = Regex.Replace(Htmlstring, @"<!--.*" , "" , RegexOptions.IgnoreCase);
   Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);" , "\"" , RegexOptions.IgnoreCase);
   Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);" , "&" , RegexOptions.IgnoreCase);
   Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);" , "<" , RegexOptions.IgnoreCase);
   Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);" , ">" , RegexOptions.IgnoreCase);
   Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);" , " " , RegexOptions.IgnoreCase);
   Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);" , "\xa1" , RegexOptions.IgnoreCase);
   Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);" , "\xa2" , RegexOptions.IgnoreCase);
   Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);" , "\xa3" , RegexOptions.IgnoreCase);
   Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);" , "\xa9" , RegexOptions.IgnoreCase);
   Htmlstring = Regex.Replace(Htmlstring, @"&#(\d+);" , "" , RegexOptions.IgnoreCase);
   Htmlstring = Regex.Replace(Htmlstring, @"<img[^>]*>;" , "" , RegexOptions.IgnoreCase);
   Htmlstring.Replace( "<" , "" );
   Htmlstring.Replace( ">" , "" );
   Htmlstring.Replace( "\r\n" , "" );
   Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();
   return  Htmlstring;
   }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值