案例:本文主要描述如何根据快递单号使用Java+Selenium爬取”爱查快递网页“快递的跟踪信息并按照设计的数据格式返回数据
解决问题:爬取JavaScript返回的网页数据(网站为了保护自己的数据,没有把数据直接放在网页源代码中返回,而是采用异步的方式,用JS返回数据,无法直接抓取)
环境准备:Chrome浏览器、Chrome浏览器驱动文件(chromedriver.exe)
注:chromedriver.exe下载地址:http://chromedriver.storage.googleapis.com/index.html
一、首先创建一个maven工程,配置依赖包
<dependencies>
<!-- selenium-java -->
<dependency>
<groupId>org.seleniumhq.selenium</groupId>
<artifactId>selenium-java</artifactId>
<version>2.44.0</version>
</dependency>
<!-- https://mvnrepository.com/artifact/org.apache.poi/poi -->
<dependency>
<groupId>org.apache.poi</groupId>
<artifa