一、它可以做什么
小时候玩网游时,接触过一款名为“按键精灵”的软件,可以用它先录好一些点击事情,例如让游戏人物在原地转圈,发招打怪等,之后自己就可以不用重复点鼠标,按键精灵能帮我们反复执行动作。selenium的作用,与之类似,他是一款自动化工具,是网页自动化测试、网页数据爬虫的利器。
二、一个最简单的例子
1、获取依赖包
获取selenium-server-standalone-2.25.0.jar并引入到项目中
获取chrome浏览器内核driver程序
chromedriver.exe,并放到
D:/WebDriver/
2、例子程序(
配好依赖包,可直接用哦)
import org.openqa.selenium.By;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.chrome.ChromeDriver;
/**
* 这段程序演示了:借助 selenium,启动 chrome浏览器,并登录QQ邮箱的过程
*
* @author lizeyang
*
*/
public class SeleniumUtil
{
// 浏览器程序的路径
private String webBrowserPath = "";
private WebDriver driver = null;
private String loginUrl = "https://mail.qq.com/cgi-bin/loginpage" ;// QQ邮箱的登录页
private String username = "10000"; // QQ帐号
private String password = "helloworld"; // QQ密码
// 初始化 selenium要调用的浏览器并启动
public void init()
{
webBrowserPath = "D:/WebDriver/chromedriver.exe" ;
System. setProperty( "webdriver.chrome.driver", webBrowserPath );
driver = new ChromeDriver();
}
// 关闭浏览器
public void quitDrvier()
{
if ( null != driver)
{
driver .quit();
}
}
public void waitForSecond()
{
try
{
Thread. sleep(1000);
}
catch (InterruptedException e)
{
e.printStackTrace();
}
}
// 模拟登录过程
public void login()
{
driver .get(loginUrl ); // 进入QQ登录页
WebElement element = driver .findElement(By.id( "uin" ));// 找到id名为 uin的dom 元素
element.sendKeys( username );// 当前element为 uin输入框,将用户名填到这个输入框
waitForSecond(); // 让进程等待一会,避免偶尔出现的元素获取异常
element = driver .findElement(By.id( "p" ));// 找到id名为p的 dom元素
element.sendKeys( password );// 将密码填入
waitForSecond();
element = driver .findElement(By.id( "btlogin" ));// 找到登录按钮
waitForSecond();
element.click(); // 点击登录按钮
}
public void demo()
{
init();
login();
// quitDrvier();
}
public static void main(String[] args)
{
SeleniumUtil util = new SeleniumUtil();
util.demo();
}
}
你可以直接将这段代码copy到你新建的工程中并运行,你看到的效果是:程序自动地启动了一个浏览器,来到QQ邮箱登录页,帐号密码被自动填充到相应输入框,登录到邮箱中
三、页面元素的捕获
使用selenium过程中,一个重要过程,就是对页面元素进行获取,之后才能对这个页面元素做相应操作。因此,这里对页面元素的捕获做一个补充说明。
如例子程序中所示,获取页面元素的基本方法是
driver
.findElement().你可以给
findElement()传入多个参数,表示不同的页面元素寻找方法.例如通过查找页面元素的id是通过By.id这个名字。
更多的方法如下图所示:

这里特别推荐xpath的方式,Xpath的能力非常强大,基本上所有的元素都能拿到。例如,就算页面元素既没有id号,又没有唯一的class名称,它的父节点是一个div,拥有class名为paginatorBatchSizes,而它自己本身是一个span元素,那么By.xpath("//div[@class='paginatorBatchSizes']/span")就能拿到这个元素。总而言之,Xpath的能力,还有更多的想象空间,但它具体还有哪些能力,这里就不展开了,可以到
Xpath常见用法做进一步了解