1:String docExplainStr = docExplain.replaceAll("<{1}[^<>]*>{1}","");
2: String docExplainStr = docExplain.replaceAll("<.*?>", "");
去除xml标签,抽取文本内容
最新推荐文章于 2023-03-09 14:15:05 发布
本文介绍了一种使用Java进行字符串处理的方法,特别是如何利用正则表达式去除HTML标签,适用于网页内容的初步清洗。
3437





