Selenium详细介绍及案例代码

最新推荐文章于 2025-04-22 16:27:43 发布

Yolo-bug

最新推荐文章于 2025-04-22 16:27:43 发布

阅读量1.1k

点赞数 24

文章标签： selenium python 测试工具

本文链接：https://blog.youkuaiyun.com/qq_54680501/article/details/146222460

版权

Selenium是一个强大的Web自动化工具，广泛应用于自动化测试、数据爬取和浏览器操作模拟等领域。本文将从Selenium的定义、应用场景、核心组件、优势、示例代码等方面进行详细介绍。

一、Selenium的定义

Selenium是一个开源的Web自动化测试工具，最初是为网站自动化测试而开发的。它支持多种编程语言（如Python、Java、C#等），能够模拟用户在浏览器中的操作，如点击、输入、滚动等。Selenium通过浏览器驱动（如ChromeDriver、GeckoDriver）与浏览器进行交互，实现自动化操作。

二、Selenium的应用场景

自动化测试：Selenium可以模拟用户操作，自动执行测试用例，并验证网页的功能和性能。
数据爬取：对于需要JavaScript渲染的动态网页，传统的爬虫工具（如Requests）无法直接获取数据。Selenium可以模拟浏览器加载页面，获取完整的页面内容。
浏览器操作模拟：Selenium可以用于自动化完成一些重复性的网页操作，如自动登录、表单提交、文件上传等。
跨平台与多浏览器支持：Selenium支持Windows、Linux、macOS等操作系统，以及Chrome、Firefox、Edge、Safari等主流浏览器。

三、Selenium的核心组件

Selenium IDE：嵌入到Firefox浏览器中的一个插件，实现简单的浏览器操作录制与回放功能，主要用于快速创建BUG及重现脚本，可转化为多种语言。
Selenium RC：核心组件，支持多种不同语言编写自动化测试脚本，通过其服务器作为代理服务器去访问应用，达到测试的目的。
Selenium WebDriver：一个浏览器自动化框架，它接受命令并将它们发送到浏览器。它是通过特定于浏览器的驱动程序实现的，直接与浏览器通信并对其进行控制。
Selenium Grid：测试辅助工具，用于做分布式测试，可以并行执行多个测试任务，提升测试效率。

四、Selenium的优势

开源与免费：Selenium完全开源，对商业用户也没有任何限制。
多浏览器与多平台支持：支持多种主流浏览器和操作系统。
丰富的生态系统：支持多种编程语言和测试框架。
真实用户模拟：Selenium测试直接在浏览器中运行，就像真实用户所做的一样，能够发现浏览器的不兼容性。
支持动态内容：能够处理JavaScript渲染后的页面数据获取。

五、Selenium的示例代码

以下是一些使用Selenium的示例代码，展示了如何打开网页、查找元素、执行操作等。

示例1：打开百度并搜索关键词

from selenium import webdriver
from time import sleep

# 实例化Chrome浏览器对象
driver = webdriver.Chrome(executable_path=r'C:\path\to\chromedriver.exe')

# 打开百度网页
driver.get('https://www.baidu.com/')

# 等待2秒
sleep(2)

# 查找搜索框并输入关键词
text_input = driver.find_element_by_id('kw')
text_input.send_keys('Selenium')

# 查找搜索按钮并点击
search_button = driver.find_element_by_id('su')
search_button.click()

# 等待3秒以查看搜索结果
sleep(3)

# 获取当前的页面源码数据（渲染后的数据）
print(driver.page_source)

# 关闭浏览器
driver.quit()

示例2：处理动态内容

对于需要JavaScript渲染的页面，Selenium可以获取完整的页面内容。以下是一个示例，展示了如何滚动页面并获取动态加载的内容。

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from time import sleep

# 设置Chrome浏览器选项（无头模式）
chrome_options = Options()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')

# 实例化Chrome浏览器对象
driver = webdriver.Chrome(executable_path=r'C:\path\to\chromedriver.exe', options=chrome_options)

# 打开需要爬取的网页
url = 'https://example.com/dynamic-page'
driver.get(url)

# 等待页面加载
sleep(3)

# 执行JS代码，自动向下滚动页面
for i in range(3):
    driver.execute_script('window.scrollTo(0, document.body.scrollHeight);')
    sleep(3)

# 获取当前的页面源码数据（渲染后的数据）
page_source = driver.page_source

# 关闭浏览器
driver.quit()

# 将页面源码保存到文件
with open('dynamic_page.html', 'w', encoding='utf-8') as f:
    f.write(page_source)

示例3：自动化登录

以下是一个示例，展示了如何使用Selenium自动登录网站。

from selenium import webdriver
from time import sleep

# 实例化Chrome浏览器对象
driver = webdriver.Chrome(executable_path=r'C:\path\to\chromedriver.exe')

# 打开登录网页
url = 'https://example.com/login'
driver.get(url)

# 等待2秒
sleep(2)

# 切换到登录iframe（如果登录框在iframe中）
driver.switch_to.frame('login_frame')

# 查找用户名输入框并输入用户名
username_input = driver.find_element_by_id('username')
username_input.send_keys('your_username')

# 查找密码输入框并输入密码
password_input = driver.find_element_by_id('password')
password_input.send_keys('your_password')

# 查找登录按钮并点击
login_button = driver.find_element_by_id('login_button')
login_button.click()

# 等待5秒以查看登录结果
sleep(5)

# 获取当前的页面源码数据（登录后的页面）
page_source = driver.page_source

# 关闭浏览器
driver.quit()

# 将登录后的页面源码保存到文件
with open('logged_in_page.html', 'w', encoding='utf-8') as f:
    f.write(page_source)