如果前端使用的是富文本编辑器,那么在编辑文档的时候数据库就会存一些样式标签例如<br> <p></p> <style>等等,有时间我们需要拿到一些纯净的数据,例如导出的时间,我们就不想这些标签展示,那么就可以使用正则来替换掉这些有一定规律的字符换
String str1="<p> Hello <style> Word </br>";
//第一种方法
Pattern pattern = Pattern.compile("<.*?>");
Matcher matcher = pattern.matcher(str1);
String result = matcher.replaceAll("");
//第二种方法
String result1 = str1.replaceAll("<.*?>" ,"");
System.out.println(result);
System.out.println(result1);
}
以上两种方法都可以实现上述需求 输出为 :Hello Word
本文介绍如何使用正则表达式去除富文本编辑器产生的HTML标签,从而获取纯净文本内容。通过两种方法实现:Pattern和Matcher类及String类的replaceAll方法。
1774

被折叠的 条评论
为什么被折叠?



