用正则表达式过滤数据中的html标签

最新推荐文章于 2022-06-14 16:13:10 发布

feveryworld

最新推荐文章于 2022-06-14 16:13:10 发布

阅读量600

点赞数

CC 4.0 BY-SA版权

分类专栏： java

本文链接：https://blog.youkuaiyun.com/u012001724/article/details/52413118

java 专栏收录该内容

4 篇文章

订阅专栏

本文介绍了一种利用正则表达式去除文本中HTML标签的方法，这对于净化文本数据，便于进一步处理如导出为Word或Excel非常有用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

到我们网页中使用了各种编辑器后，可能会使我们的数据受到污染，也就是存储各种html标签，当我们想导出word或excel时想要去掉这些标签，这时候正则表达式就是很好的处理方法：

public static void main(String[] args) {
		String str1="简要描述事故处理工作流程。</p></span>";
//		String str1="<p>简要描述事故处理工作流程。</p></span>";
//		String str1="<span>简要描述事故处理工作流程。</p></span>";
		str1 = str1.replaceAll("\\<[^>]+>", ""); 
		System.out.println(str1);
	}

输出：简要描述事故处理工作流程。