Selenium超简单入门

最新推荐文章于 2025-10-13 12:00:48 发布

原创最新推荐文章于 2025-10-13 12:00:48 发布 · 4.8w 阅读

53 ·

CC 4.0 BY-SA版权

文章标签：

#selenium #爬虫 #自动化测试

Selenium 专栏收录该内容

2 篇文章

订阅专栏

本文介绍Selenium这款自动化工具的基础使用方法，包括如何启动浏览器、登录QQ邮箱，并详细解释了页面元素的定位技巧。

部署运行你感兴趣的模型镜像

一、它可以做什么

小时候玩网游时，接触过一款名为“按键精灵”的软件，可以用它先录好一些点击事情，例如让游戏人物在原地转圈，发招打怪等，之后自己就可以不用重复点鼠标，按键精灵能帮我们反复执行动作。selenium的作用，与之类似，他是一款自动化工具，是网页自动化测试、网页数据爬虫的利器。

二、一个最简单的例子

1、获取依赖包

获取selenium-server-standalone-2.25.0.jar并引入到项目中

https://code.google.com/p/selenium/downloads/detail?name=selenium-server-standalone-2.25.0.jar&can=2&q=label%3AFeatured

获取chrome浏览器内核driver程序 chromedriver.exe，并放到 D:/WebDriver/

https://code.google.com/p/chromedriver/downloads/detail?name=chromedriver2_win32_0.8.zip&can=2&q=

2、例子程序（配好依赖包，可直接用哦）

import org.openqa.selenium.By;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.chrome.ChromeDriver;

/**
 * 这段程序演示了:借助 selenium，启动 chrome浏览器，并登录QQ邮箱的过程
 *
 * @author lizeyang
 *
 */
public class SeleniumUtil
{
        // 浏览器程序的路径
        private String webBrowserPath = "";

        private WebDriver driver = null;

        private String loginUrl = "https://mail.qq.com/cgi-bin/loginpage" ;// QQ邮箱的登录页
        private String username = "10000"; // QQ帐号
        private String password = "helloworld"; // QQ密码

        // 初始化 selenium要调用的浏览器并启动
        public void init()
       {
               webBrowserPath = "D:/WebDriver/chromedriver.exe" ;
              System. setProperty( "webdriver.chrome.driver", webBrowserPath );
               driver = new ChromeDriver();
       }

        // 关闭浏览器
        public void quitDrvier()
       {
               if ( null != driver)
              {
                      driver .quit();
              }
       }

        public void waitForSecond()
       {
               try
              {
                     Thread. sleep(1000);
              }
               catch (InterruptedException e)
              {
                     e.printStackTrace();
              }
       }

        // 模拟登录过程
        public void login()
       {
               driver .get(loginUrl ); // 进入QQ登录页
              WebElement element = driver .findElement(By.id( "uin" ));// 找到id名为 uin的dom 元素
              element.sendKeys( username );// 当前element为 uin输入框，将用户名填到这个输入框
              waitForSecond(); // 让进程等待一会，避免偶尔出现的元素获取异常
              element = driver .findElement(By.id( "p" ));// 找到id名为p的 dom元素
              element.sendKeys( password );// 将密码填入
              waitForSecond();
              element = driver .findElement(By.id( "btlogin" ));// 找到登录按钮
              waitForSecond();
              element.click(); // 点击登录按钮
       }

        public void demo()
       {
              init();
              login();
               // quitDrvier();
       }

        public static void main(String[] args)
       {
              SeleniumUtil util = new SeleniumUtil();
              util.demo();
       }

}

你可以直接将这段代码copy到你新建的工程中并运行，你看到的效果是：程序自动地启动了一个浏览器，来到QQ邮箱登录页，帐号密码被自动填充到相应输入框，登录到邮箱中

三、页面元素的捕获

使用selenium过程中，一个重要过程，就是对页面元素进行获取，之后才能对这个页面元素做相应操作。因此，这里对页面元素的捕获做一个补充说明。

如例子程序中所示，获取页面元素的基本方法是 driver .findElement().你可以给 findElement()传入多个参数，表示不同的页面元素寻找方法.例如通过查找页面元素的id是通过By.id这个名字。

更多的方法如下图所示：

这里特别推荐xpath的方式，Xpath的能力非常强大，基本上所有的元素都能拿到。例如，就算页面元素既没有id号，又没有唯一的class名称，它的父节点是一个div，拥有class名为paginatorBatchSizes，而它自己本身是一个span元素，那么By.xpath("//div[@class='paginatorBatchSizes']/span")就能拿到这个元素。总而言之，Xpath的能力，还有更多的想象空间，但它具体还有哪些能力，这里就不展开了,可以到 Xpath常见用法做进一步了解

您可能感兴趣的与本文相关的镜像