asp.net过滤HTML方法

本文介绍了一种用于HTML内容过滤的方法,该方法通过正则表达式匹配并移除指定样式的字体标签,实现对特定格式文本的清洗。

可以扩展很多,也可以用此方法做采集信息,

fck("过滤的字符串", @"<font color=""#ff0000"">.*?</font>", @"<font color=""#ff0000"">", @"</font>")

 public string fck(string htmls, string pattern, string patternstart, string patternend)
        {
            Regex regex = new Regex(@pattern, RegexOptions.IgnoreCase);
            MatchCollection mc = regex.Matches(htmls);
            string htmlreplace = string.Empty;
            foreach (Match m in mc)
            {
                if (m.Success)
                {
                    htmlreplace = m.Value.Replace(patternstart, "");
                    htmlreplace = htmlreplace.Replace(patternend, "");
                    htmls = htmls.Replace(m.Value, htmlreplace);
                }
            }
            return htmls;
        }

转载于:https://www.cnblogs.com/stulife/archive/2010/04/12/1710390.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值