到我们网页中使用了各种编辑器后,可能会使我们的数据受到污染,也就是存储各种html标签,当我们想导出word或excel时想要去掉这些标签,这时候正则表达式就是很好的处理方法:
public static void main(String[] args) {
String str1="简要描述事故处理工作流程。</p></span>";
// String str1="<p>简要描述事故处理工作流程。</p></span>";
// String str1="<span>简要描述事故处理工作流程。</p></span>";
str1 = str1.replaceAll("\\<[^>]+>", "");
System.out.println(str1);
}
输出:简要描述事故处理工作流程。
str1.replaceAll("\\<[^>]+>", "");
这段正则表达式很好的去除了html标签,简单实用。