1.第一步就是引入依赖
<!-- selenium -->
<dependency><groupId>org.seleniumhq.selenium</groupId>
<artifactId>selenium-java</artifactId>
<version>3.4.0</version>
</dependency>
2.由于火狐浏览器和谷歌浏览器的特殊原因,这两个浏览器的启动要依靠二进制的文件;
文件的链接如下:
链接:https://pan.baidu.com/s/1mhBcQBA 密码:3x3z
启动谷歌浏览器的代码如下:
System.setProperty("webdriver.chrome.driver", "D:\\selenium\\chromedriver.exe");
WebDriver driver = new ChromeDriver();
启动火狐浏览器的代码如下:
// 指定驱动的地址(火狐浏览器的驱动)
System.setProperty("webdriver.gecko.driver", "D:\\firefox\\geckodriver.exe");
// /*
// * 禁用图片(火狐)
// */
// // 关图片
// FirefoxProfile firefoxProfile = new FirefoxProfile();
// firefoxProfile.setPreference("permissions.default.image", 2);
//
// // 关掉flash
// firefoxProfile.setPreference("dom.ipc.plugins.enabled.libflashplayer.so", false);
driver = new FirefoxDriver();
下面的不需要驱动:
WebDriver driver = new HtmlUnitDriver();
获取到网页之后,就可以分析网页的结构,利用JSoup去解析就好;