【Playwright自动化】安装和使用

Playwright安装与使用指南

一、前言

Playwright 简介

Playwright 是一个由 Microsoft 开发的现代化端到端测试框架,支持 Chromium、Firefox 和 WebKit 内核的浏览器自动化。它专为测试 Web 应用设计,提供跨浏览器、跨平台(Windows、macOS、Linux)的兼容性,并支持多语言(JavaScript/TypeScript、Python、Java、.NET)。

核心特性包括:

  • 多浏览器支持:无需额外配置即可在 Chromium、Firefox 和 WebKit 上运行测试。
  • 自动等待机制:内置智能等待,减少手动添加等待时间的需求。
  • 网络拦截与模拟:可拦截和修改网络请求,模拟慢速网络或离线状态。
  • 并行测试:原生支持多线程和浏览器上下文隔离,提升测试效率。
  • 移动端模拟:通过设备描述符模拟移动设备(如 iPhone、iPad)。

Selenium 简介

Selenium 是历史悠久的 Web 自动化工具,核心由 WebDriver 协议驱动,支持多种编程语言(Python、Java、C# 等)和浏览器(需对应浏览器驱动)。

核心特性包括:

  • 广泛的浏览器支持:依赖浏览器驱动(如 ChromeDriver、GeckoDriver)。
  • 社区生态成熟:拥有大量插件和扩展(如 Selenium Grid 用于分布式测试)。
  • 灵活的集成能力:可与 TestNG、JUnit 等测试框架结合。

Playwright 与 Selenium 对比

架构与性能
  • Playwright:直接通过浏览器开发者协议(CDP)通信,无需中间驱动,启动更快。支持多浏览器上下文隔离,适合并行测试。
  • Selenium:依赖 WebDriver 协议,需单独安装浏览器驱动,启动速度较慢。并行测试需依赖 Selenium Grid。
自动化能力
  • Playwright:内置文件上传/下载、截图录屏、跨域处理等高级功能。网络拦截无需第三方库。
  • Selenium:需依赖第三方库(如 Selenium Wire)实现高级功能,基础功能需额外代码实现。
代码示例对比

Playwright(Python)

from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    browser = p.chromium.launch()
    page = browser.new_page()
    page.goto("https://example.com")
    print(page.title())
    browser.close()

Selenium(Python)

from selenium import webdriver

driver = webdriver.Chrome()
driver.get("https://example.com")
print(driver.title)
driver.quit()

适用场景
  • 选择 Playwright:需要快速执行、跨浏览器测试或高级功能(如网络模拟)。
  • 选择 Selenium:需兼容旧项目或依赖 Selenium 生态的插件/工具。

两者均可满足 Web 自动化需求,但 Playwright 在性能、易用性和功能丰富度上更具优势,尤其适合新项目。

二、安装 Playwright for Python

确保已安装 Python(推荐 3.7 或更高版本),并通过 pip 安装 Playwright 包:

pip install playwright

安装浏览器二进制文件

Playwright 需要特定版本的浏览器(Chromium、Firefox、WebKit)支持,运行以下命令自动下载:

playwright install

验证安装

创建简单的测试脚本(例如 test_playwright.py)验证功能是否正常:

from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    browser = p.chromium.launch(headless=False)
    page = browser.new_page() # 打开一个标签页
    page.goto("https://www.baidu.com") # 打开百度地址
    print(page.title()) # 打印当前页面title
    browser.close() # 关闭浏览器对象

运行脚本:

python test_playwright.py

若输出网页标题(如 "百度一下,你就知道"),则安装成功。

可选:异步 API

Playwright 支持异步操作,适用于异步框架(如 asyncio):

import asyncio
from playwright.async_api import async_playwright


async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)
        page = await browser.new_page()
        await page.goto("https://www.baidu.com")
        print(await page.title())
        await browser.close()

asyncio.run(main())

三、headless 模式

headless 模式指无图形用户界面(GUI)的运行方式,通常用于浏览器、应用程序或操作系统。该模式通过命令行或脚本操作,适用于自动化测试、服务器环境或资源受限的场景。

headless 模式的应用场景

  • 自动化测试:调用 headless 浏览器执行网页测试。
  • 爬虫开发:无界面浏览器可模拟用户操作,绕过反爬机制。
  • 服务器环境:在无显示设备的服务器上运行需要浏览器支持的工具(如 PDF 生成)。

headless 模式的优缺点

优点

  • 节省系统资源,无需渲染图形界面。
  • 支持脚本化操作,易于集成到 CI/CD 流程。

缺点

  • 部分依赖 GUI 交互的功能无法使用(如手势操作)。
  • 调试复杂,需依赖日志或远程调试端口。

基本无头浏览器启动

使用playwright.sync_api模块同步模式启动无头浏览器(以Chromium为例):

from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    browser = p.chromium.launch(headless=True)  # 无头模式
    page = browser.new_page()
    page.goto("https://www.baidu.com")
    print(page.title())
    browser.close()

异步模式示例

异步接口更适合高性能爬虫或自动化任务:

import asyncio
from playwright.async_api import async_playwright

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()
        await page.goto("https://www.baidu.com")
        print(await page.title())
        await browser.close()

asyncio.run(main())
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

热爱编程的小白白

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值