使用selenium中元素定位相关知识总结

最新推荐文章于 2024-08-04 20:56:54 发布

原创最新推荐文章于 2024-08-04 20:56:54 发布 · 1.1k 阅读

4 ·

CC 4.0 BY-SA版权

Selenium 专栏收录该内容

6 篇文章

订阅专栏

本文详细介绍了使用Selenium进行Web页面自动化时的元素定位方法，包括Python和Java中的API，如find_element_by_id、find_elements_by_xpath等，以及XPath和CSS选择器的深入解析。

部署运行你感兴趣的模型镜像

使用selenium做web页面自动化时，最重要的工作的就是进行元素的定位，只有定位到元素才能进行后续的操作，例如点击一个按钮前，你必须先要知道这个按钮在哪里。

元素定位接口

Python

selenium为单个元素定位，提供了8个API：

selenium选择器接口
接口名称	功能说明	返回值
find_element_by_id	根据页面元素的Id，寻找元素	能找到则返回一个代表这个元素的WebElement对象，否则抛出NoSuchElementException异常。即使有多一个元素符合条件，仅返回最先发现的那个元素的对象。
find_element_by_name	根据页面元素的name，寻找元素	同上
find_element_by_class_name	根据页面元素的class name，寻找元素	同上
find_element_by_xpath	根据页面元素的xpath，寻找元素	同上
find_element_by_css_selector	根据页面元素的css，寻找元素	同上
find_element_by_tag_name	根据页面元素的tag名字，寻找元素。很少用，同一类元素都有相同的唐名字	同上
find_element_by_link_text	根据页面元素的完整的链接字符串，寻找元素	同上
find_element_by_partial_link_text	根据页面元素的部分链接字符串，寻找元素，模糊查找	同上

上面的接口返回的是单个元素，还有一组类似的接口，返回的是元素符合条件的元素对象列表：

find_elements_by_id	返回值是一个列表或空列表
find_elements_by_name	同上
find_elements_by_name	同上
find_elements_by_xpath	同上
find_elements_by_css_selector	同上
find_elements_by_tag_name	同上
find_elements_by_link_text	同上
find_elements_by_partial_link_text	同上

实际上上面2组接口都是调用find_element和find_elements实现的，这2个接口是私有的，不过你也可以调用的（因为python中没啥东西真的私有滴）

from selenium import webdriver
from selenium.webdriver.common.by import By


driver = webdriver.Chrome("C:\\selenium\\chromedriver.exe")
driver.get("http://www.baidu.com")
pp = driver.find_elements(By.ID, "adsfasd")

JAVA

Java中定位接口更简练些，只有find_element和find_elements

xpath和css定位技术

通过对上面元素定位接口的研究，我们知道我们可以用来进行定位的有 id，name， class name， tag name， link text， partial link text， xpath 和 css。

在实际使用中，有时候id，name， class name， tag name， link text， partial link text，可能不存在，或者可能会发生变化，又或者肯能存在重复的问题，这时候我们就需要更复杂的定位手段了。他们就是xpath和css，但是相对的这个2个定位方法学习起来更难一些，所以在这里对这2中方法进行详细的介绍。

xpath

xpath是XML中的一种定位语言，因为HTML可以说是XML规范的一种实现，所以xpath也可以用在HTML中元素的定位。除了通过绝对路径进行定位，xpath还支持相对定位等待。

工具：

通过Firefox的FirePath插件可以方便的获取到xpath值. 由于最新版火狐不在支持FireBug等开发工具，可以通过https://ftp.mozilla.org/pub/firefox/releases/ 下载49版本以下的火狐就可以增加Firebug等扩展了。

我使用的chrome版本是75.0.3770.100，通过右击页面，选择检查，或通过更多工具-开发者工具，都可以打开debug工具，点中工具左上角的箭头图标，然后选择要定位的元素，在工具里会显示元素的信息，右击元素 -》 copy- 》 copy xpath

xpath基础知识

术语解释

<?xml version="1.0" encoding="UTF-8"?>

<bookstore>
  <book>
    <title lang="en">Harry Potter</title>
    <author>J K. Rowling</author>
    <year>2005</year>
    <price>29.99</price>
  </book>
</bookstore>

上面例子中：

<bookstore> 为文档节点，也称为根节点

<author>J K. Rowling</author> 为元素节点

lang=“en” 为属性节点

“en” 和J K. Rowling 被称为基本值

book 是 title，author， year，price的父节点-----parent

title，author， year，price 是 book的子节点-----Children

title，author， year，price 是兄弟节点------Sibling

title的先辈是book和bookstore--------Ancestor

bookstore的后代则是 book， title，author， year，price ------ Descendant

xpath语法

1. 使用路径表达式定位节点

路径分为绝对路径和相对路径：

绝对路径从根节点开始，使用 / 开头，代表从根一直到当前节点

相对路径以 // 开头根据要定位的元素的特征来进行定位

节点之间关系的表示：

当前节点用单个点 . 表示

当前节点的父节点用 2个点 .. 表示

2. 使用谓语来定位节点

当单纯的路径表达式无法准确定位时，我们可以使用谓语来进一步定位。谓语被置于中括号内。

//*[@id="u1"]/a[2]  根据索引进行元素定位（下标从1开始）

//*[@id="u1"]/a[last()] 根据索引进行元素定位，我们可以获得最后一个元素

//*[@id="u1"]/a[last() -1] 根据索引进行元素定位，我们可以获得倒数第二个元素

//*[@id="u1"]/a[position()<3] 根据索引进行元素定位，我们可以获得前2个元素

//*[@id="u1"]/a[@name]  目标元素要具有指定的属性

//*[@id="u1"]/a[@name="news"] 目标元素不仅需要包含属性name，而且属性的值必须是news

//*[@id="u1"]/a[text()="news"] 通过标签的文本来定义节点 也可以写成//*[@id="u1"]/a[.="news"]， 用这个方法时，标签必须有文本才行

//*[@id="u1"]/a[contains(text(),"news")]   这是一种模糊查找， 只要那个a标签的文本包含news，就符合条件

//*[@id="u1"]/a[contains(@name,"news")]    与上面相同，这是一种模糊查找， 只要那个a标签的name属性的值包含news，就符合条件



通过标签的文本来定义节点   也可以写成//*[@id="u1"]/a[.="news"]

3. 通配符

用来获取哪些未知的节点元素

* 可以用来代表任何元素节点 //*[@id="head"]/div/*

@* 可以用来标识任何属性 //*[@id="head"]/div/div[@*] 代表目标div必须有至少有一个属性

4. 一次获取多个节点元素

这多个元素通常没有什么关联性

//*[@id="head"]/div | //*[@id="form"]/span[1]   可以定位2个不相关的元素

5. 轴定位

就是靠节点间的父子关系来定位，适合用于相对位置较为固定的节点结构

语法规则：当前节点/关系类型::目标节点特征

关系类型包括：父节点（parent）、子节点（child）、祖先节点（ancestor）、子孙节点（descendant）、后节点（following）前节点（preceding）、后兄弟节点（following-sibling）、前兄弟节点（preceding-sibling）

<html><head></head><body>
        
    

    <div>  #div1
            <input>
        	<a>big</a>
        	<img name="haha">
    		<button></button>
                <div>1</div>   #div4
        </div>
    
    <div> #div2
                <input>
        	<a>small</a>
        	<img name="haha2">
    		<button></button>
                <div>2</div>   #div5
    </div>
    
    <div> #div3
                <input>
        	<a>large</a>
        	<img name="haha3">
    		<button></button>
                <div>3</div>   #div6
    </div>

    
</body></html>

参考上图，举例说明各个关系是怎么运用的：

/html/body/div[1]/img/parent::*/input 以img为当前节点，获取它的parent（因为只有一个parent，所以可以用星号），然后定位到parent下的input节点

/html/body/div[1]/child::img 以div1为当前节点，获取它的所有子节点，从这些子节点中找到img节点

/html/body/div[1]/img/ancestor::body 以img为当前节点，获取它的所有先辈节点（div1，body 和html），然后定位到body节点

/html/body/descendant::img[@name="haha"] 以body为当前节点，获取所有的子孙节点，从中定位到name属性为哈哈的img节点

/html/body/div[1]/following::div[2] 以div1为当前节点，获取与div1同级的后面所有节点及其所有子孙节点，从中定位第二个div。主要注意的是如果后面节点中存在多层结构，每层结构中都有div，索引是从上到下，而与层级没有关系，本例中第二个div是上图中那个div5

/html/body/div[3]/preceding::div[1] 以div3为当前节点，获取与div3同级的前面所有节点及其所有子孙节点，从中定位我们要定位的元素。主要最后的div[1]定位的是div5，索引是从下到上的

/html/body/div[1]/following-sibling::div[1] 以div1位当前节点，获取与div1同级的后面的所有兄弟节点（不包含兄弟节点的子孙节点），从中定位一个我们要的元素。注意最后一个div[1] 定位的是div2

/html/body/div[3]/preceding-sibling::div[1] 以div3位当前节点，获取与div2同级的前面的所有兄弟节点，从中定位div2，注意此处的索引是从下向上的。

6. 使用辅助函数进行定位

其实我们前边已经用过了，就是那个contains函数，能够支持的函数如下：

starts-with: 定位属性或文本以指定字符开头的节点

/html/body/div/a[starts-with(text(),"b")] 定位到 <a>big</a>

/html/body/div/img[starts-with(@name,"haha")] 会定位到3个img节点

contains: 定位属性或文本中包含指定字符串的节点

/html/body/div/img[contains(@name,"haha")] 会定位到3个img节点

text：获取节点的文本，可以用 . 代替

last：获取定位到一组节点的最后一个节点的索引

not：取反操作

/html/body/div/a[ not(contains(.,"s"))] 会选中big和large 这个2个节点

7. 运算符

这些运算符用于谓语中，构建过滤条件

+, -, *, div，mod：算数运算，加减乘除和取余，主要用来计算索引值

=, !=, >=, <=, >, <: 比较运算符，建立过滤条件 //div[. > 1] 就会定位到div5

or, and： 逻辑运算符，连接多个条件构成过滤条件 //div[. = 1 or . = 2] 会选定div4 和div5

CSS选择器定位

其实如果会用xpath，也可以不学css了，不过技多不压身嘛！但是，我如果太久不用定位，就经常弄混css和xpath的语法，哎

先弄一个例子，所有的操作都是针对这个例子的

<html><head></head><body>
        
    

    <div>  #div1
            <input id="test1" class="sweet1">
        	<a>big</a>
        	<img name="haha">
    		<button></button>
                <div>1</div>   #div4
        </div>
    
    <div> #div2
                <input id="test2" class="sweet2">
        	<a>small</a>
        	<img name="haha2">
    		<button  class="abc efg hhh" name="ddd eee fff"></button>
                <div>2</div>   #div5
    </div>
    
    <div> #div3
                <input id="test3" class="sweet3">
        	<a>large</a>
        	<img name="haha3">
    		<button class="abc-efg-hhh" name="ddd-eee-fff"></button>
                <div>3</div>   #div6
    </div>

    
</body></html>

我们从简单到复杂，一步一步来

一：使用单个属性进行定位

1. 使用id进行定位

#test1 定位到第一个input节点，这里#有特殊意义，其后是id的值，作用类似于xpath中的 [@id="test1"]

.sweet3 定位到第三个input节点，注意第一个字符是个点（.），其后是class属性的值，作用类似xpath中 [@class="sweet3"]

input 会搜索到3个input节点，这个就是仅仅根据标签名进行定位

[name] 仅仅id和class属性有上面的特殊书写方式，其他属性就没这个权利了。这个会搜索到所有包含name属性的节点

[name=haha] 或者 [name="haha"] 会定位到第一个input节点，注意haha可以带引号也可以不带，但xpath是需要给属性值加引号的，另外xpath中属性名前要加@

二. 使用多个属性组合来进行定位

input.sweet3 代表要找的是，class属性是sweet3的input标签

input#test1 代表要找的是，id属性是test1的input标签

input[name=haha] 代表要找的是，name属性是haha的input标签

input[name] 代表要找的是，拥有name属性的input标签

input[id=test1][class=sweet1] 代表要找的是，id是test1， class是sweet1的input标签，后边2个中括号是and的关系

三. 使用模糊匹配来进行定位

当属性的值中包含多个由空格隔开的字符串时，可以用其中一个字符串进行定位

button[name~=ddd] button[name~=eee] button[name~=fff]

属性的值中包含多个由空格隔开的字符串时，无法用整个属性值定位，通常只有class的值才会有空格间隔

button[name=”ddd eee fff”]

当属性的值中包含多个由空格隔开的字符串时，可以用来搜索class中开始位置是abc的节点

button[class^=abc] button[class^=ab] button[class^=a]

当属性的值中包含多个由空格隔开的字符串时，可以用来搜索class中结尾位置是hhh的节点

button[class$=hhh] button[class$=hh] button[class$=h]

当属性值中包含 -（短横杠）时，可以匹配其中一部分，但是每一部分都要精确填写

button[class|=abc-efg-hhh] button[class|=abc-efg] button[class|=abc]

四. 多个class值进行定位

button.abc.efg.hhh 当一个节点的class值为多个由空格分隔的字符串时，可以用这种方式进行定位

五. 通过层级进行定位

1. 父元素>子元素

div>input[id=test1] div>input会搜索到所有div下的input节点，然后再通过id进行限定

2. 父元素子孙元素

body * 代表body的所有子元素以及子元素的子元素。。。。

body input 代表body的所有子孙元素中的标签为input的元素

body input[id=test3] 代表body的所有子孙元素中的标签为input，且id是test3的元素

3. 通过下标定位

:nth-child(n) 理解了这个，下面的就好理解了

:nth-last-child(n) 当n为1时，表示最后一个child

:first-child 相当于nth-child(1)

:last-child 相当于nth-last-child(1)

:only-child 定位到的元素的父节点只有一个子节点时，才符合要求，后面有个例子

这些用法很难理解，查了很多地方，没搞明白，通过做实验观察结果，来总结它的用法。我们重写一个html来做实验

<html><head></head><body>
        
    

    <div>  #1
            
                <input id="test" class="sweet">   #num1
                <input id="test" class="sweet">   #num2
        	<a>big</a>
        	<img name="haha">
    		<button></button>
                <p>
                    <a>test</a> 
                </p>
                   
    </div>
    
    <div> #2
                <input id="test" class="sweet">   #num3
        	<a>small</a>
                <img></img>
                <button></button>
                <div>2</div>   #4
                <p>
                    <a>test</a> 
                    <a>test</a>
                </p>
    </div>
    
    <div> #3
                <input id="test" class="sweet">   #num4
                <a>small</a>
                <img></img>
                <button></button>
                <div>3</div>   #5
    </div>

    

 </body></html>

谁的孩子？？

.sweet:nth-child(1)

我们选中的是什么呢？选中的是#num1，#num3，#num4，这个不是很好理解，.sweet:nth-child(2)选中的是#num2，可以理解。但是.sweet:nth-child(3) 或者比3更大的值，就选不到东西了，明明.sweet能搜到4个节点，这是为什么呢？

我的理解是：.sweet:nth-child(n) 这个表达式的意思是， .sweet所定位的所有元素中，属于同一个父节点的子元素中的第n个元素。

这样，上面的结果我们是不是就可以理解了呢。不过这是我的推测，如果不正确的地方请指正。

男孩还是女孩？？

body:nth-child(1)

能理解上面那个表达式了，但是马上就遇到问题了，body:nth-child(1) 这个选不到任何元素。但是用head:nth-child(1)可以定位到head元素，为什么呢？

我的理解是：body定位到元素body，body节点的父节点是html，html的第一个子元素是head，但是head节点的标签并不是我们所需的body标签，所以没有定位的任何元素。这里的关键点是，body节点的父节点的子节点可能是各种类型的，但我们最终要定位的是body类型。

为了验证我的猜测，body:nth-child(2) 这个表达式时可以定位的body标签的。

不同辈分的孩子怎么寻找父亲？？

div:nth-child(1)

我们已经知道了，理解的关键是要找到目标元素的父节点。但是这里div能定位到的节点在不同的层级中，它能搜索到5个div节点。div:nth-child(1) 对一个的是#1， div:nth-child(2）对应的是#2， div:nth-child(3)对应的是#3， div:nth-child(4)就定位不到任何元素，div:nth-child(5)对应到了#4和#5。

我的理解是：除了处于不同节点集的元素有不同的父节点，在同一节点集中不同层次的元素也会有不同的父节点。所以这就好解释了。

当n为1时，

对于父节点body来说，它定位到的是div是#1

对于父节点是#2来说，它定位到的将是#num3，但这个元素是个input，不是我们要找的div

对于父节点是#3来说，它定位到的将是#num4，但这个元素是个input，不是我们要找的div

所以当n为1时，我们能定位一个元素，他就是#1

n为2和3时，处理过程与1相似。

当n为4时，

对于父节点body来说，它没有第四个child

对于父节点是#2来说，它定位到的这个元素是个button，不是我们要找的div

对于父节点是#3来说，它定位到的这个元素是个button，不是我们要找的div

当n为5时，