1.使用Jsoup
jsoup是一款Java的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
2.导包
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.15.4</version> //对应的版本号
</dependency>
在对应的工具模块里面的pom文件加上依赖,同时新建一个工具类,方便其他模块进行调用。
2.1新建HtmlUtils类
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
public class HtmlUtils {
private HtmlUtils() {
}
public static String stripHtml(String html) {
if (html == null) return null;
// 使用 Jsoup 解析 HTML
Document doc = Jsoup.parse(html);
// 从 Document 中提取文本,并用单个空格替换多个连续的空白字符
return doc.body().text().replaceAll("\\s+", " ");
}
}
3.调用
@Override
public Result detail(Long id) {
Result result = new Result();
Exhibit detail = exhibitMapper.selectById(id);
// 去除html标签
detail.setIntroduce(HtmlUtils.stripHtml(detail.getIntroduce()));
result.setData(detail);
return result;
}