Release Notes
- 1、【提升】爬虫JS渲染能力强化:升级提供 “Selenium + ChromeDriver” 方案支持JS渲染,兼容性更高,废弃旧Phantomjs方案。非JS渲染场景仍然Jsoup,速度更快。同时支持自由扩展其他实现。
- 2、【优化】进一步优化 Selenium 兼容问题,完善JS渲染场景下兼容性和性能。
- 3、【重构】重构核心功能模块,提升扩展性;修复历史代码隐藏问题,提升系统稳定习惯。
- 4、【升级】多个依赖升级至更新版本,如jsoup、selenium等。
引入Maven依赖
<dependency>
<groupId>com.xuxueli</groupId>
<artifactId>xxl-crawler</artifactId>
<version>${最新稳定版}</version>
</dependency>
代码示例
注意:仅供学习测试使用,如有侵犯请联系删除
提示:更多测试代码可以前往仓库查看:测试代码目录
- 爬虫名称:Gitee高星项目采集爬虫
- 爬虫功能:一行代码启动多线程爬虫,分页方式扩散爬取“Gitee开源项目列表”,通过“注