using System.Text.RegularExpressions;
private string StripHT(string strHtml) //从html中提取纯文本
{
Regex regex = new Regex("<.+?>", RegexOptions.IgnoreCase);
string strOutput = regex.Replace(strHtml, "");//替换掉"<"和">"之间的内容
strOutput = strOutput.Replace("<", "");
strOutput = strOutput.Replace(">", "");
strOutput = strOutput.Replace(" ", "");
return strOutput;
}
本文介绍了一种使用C#中的正则表达式去除HTML标签的方法,以实现从HTML内容中提取纯文本的目的。该方法利用了Regex类进行匹配并替换掉HTML标签。
2026

被折叠的 条评论
为什么被折叠?



