1. 豆瓣图书最受关注
1.1 创建SpringBoot项目或者Maven项目
1.2 引入jsoup
<dependency>
<!-- jsoup HTML parser library @ https://jsoup.org/ -->
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.15.3</version>
</dependency>
注意版本一定是1.15.3,1.15.4可能无法获取信息
1.3 爬取信息
先找到豆瓣图书网址
豆瓣
先找到整个布局的部分,list-col2,里面存储着相应的元素标签
所以document的select标签就是ul.list-col2 li,意思是选择ul里面标签list-col2ÿ