"<[^>]*>"; //去除所有的标签
"<script[^>]*?>.*?</script >" //去除所有脚本,中间部分也删除
"<img[^>]*>"; //去除图片的正则
@"<(?!br).*?>"; //去除所有标签,只剩br
"<table[^>]*?>.*?</table>"; //去除table里面的所有内容
"<(?!img|br|p|/p).*?>"; //去除所有标签,只剩img,br,p
本文介绍了一种通过正则表达式去除HTML标签的方法,包括去除所有标签、脚本、图片及特定元素如table等,保留了br标签,并确保关键信息如文本内容得以保留。
"<[^>]*>"; //去除所有的标签
"<script[^>]*?>.*?</script >" //去除所有脚本,中间部分也删除
"<img[^>]*>"; //去除图片的正则
@"<(?!br).*?>"; //去除所有标签,只剩br
"<table[^>]*?>.*?</table>"; //去除table里面的所有内容
"<(?!img|br|p|/p).*?>"; //去除所有标签,只剩img,br,p
778

被折叠的 条评论
为什么被折叠?