playwright使用教程

本文介绍了Python第三方库Playwright,它是微软开发的自动化测试工具,支持多语言,能用一个API自动执行多种浏览器操作。还说明了其使用步骤,包括引入库和脚本录制,最后给出爬取豆瓣电影信息的小demo,称其可玩性高,可深入尝试。
部署运行你感兴趣的模型镜像


前言

playwright是一个非常有趣的自动化测试工具, 支持Node.js、Python、C# 和 Java语言,在这里我将向大家介绍playwright以及它的简单使用

一、playwright是什么?

Playwright是一个是由微软开发的强大的Python第三方库,它可以仅用一个API即可自动执行Chromium(谷歌)、Firefox(火狐)等浏览器自动化操作,并同时支持以无头模式、有头模式运行。

二、使用步骤

1.引入库

tips:可以使用国内镜像源安装,会快一点

安装playwright库

pip install playwright

安装浏览器驱动文件(安装过程稍微有点慢)

python -m playwright install

2.脚本录制

使用codegen命令,以下命令查看所有用法

python -m playwright codegen --help 

效果使用该命令开始录制

python -m playwright codegen 

在这里插入图片描述然后我们就可以在弹出的浏览器中进行操作了,playwright会记录我们的一系列操作并生成对应的代码,结束后自动关闭浏览器,保存生成的自动化脚本到py文件。

from playwright.sync_api import Playwright, sync_playwright, expect


def run(playwright: Playwright) -> None:
    browser = playwright.chromium.launch(headless=False)
    context = browser.new_context()
    page = context.new_page()
    page.goto("https://www.baidu.com/")
    page.locator("#kw").click()
    page.locator("#kw").fill("playwright")
    page.get_by_role("button", name="百度一下").click()

    # ---------------------
    context.close()
    browser.close()


with sync_playwright() as playwright:
    run(playwright)

三、一个小demo

以下代码演示爬取豆瓣一周口碑榜前十的电影信息,用到了xlwt

import xlwt
from playwright.sync_api import sync_playwright

def run(playwright):
    #headless=False,设置为有头模式
    browser = playwright.chromium.launch(headless=False)
    context = browser.new_context()
    page = context.new_page()
    page.goto("https://movie.douban.com/")
    names = page.query_selector_all("//div[@class='billboard-bd']//td[@class='title']/a")
    listMovie = []
    for name in names :
        content = name.text_content()
        link = name.get_attribute("href")
        listMovie.append((content,link))
    #使用xlwt存入excel
    workbook = xlwt.Workbook(encoding='utf-8')
    worksheet = workbook.add_sheet('sheet1')
    worksheet.write(0, 0, label="名字")
    worksheet.write(0, 1, label="网址")
    for i, items in enumerate(listMovie):
        worksheet.write(i + 1, 0, items[0])
        worksheet.write(i + 1, 1, items[1])
    workbook.save('DouBanMovie.xls')
    page.close()
    context.close()
    browser.close()
with sync_playwright() as playwright:
    run(playwright)
    

结果如下:
在这里插入图片描述


总结

playwright是一个可玩性很高的python库,大家可以深入尝试
附官方文档地址:链接

您可能感兴趣的与本文相关的镜像

Python3.10

Python3.10

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

### Playwright 的基本概念与功能 Playwright 是一种强大的工具,最初被设计用于 Web 应用程序的自动化测试。随着时间的发展,它不仅限于传统的 Web 测试场景,还能够支持某些基于 Web 技术构建的桌面应用程序的操作,比如 Electron 框架开发的应用[^1]。 #### 安装 Playwright 为了开始使用 Playwright,可以通过包管理器安装相应的库。例如,在 Node.js 环境下创建一个新的项目并初始化 Playwright 可以通过以下命令完成: ```bash pnpm create playwright@latest -- --ct ``` 这条命令会引导用户设置一个全新的 Playwright 项目环境,并配置好必要的依赖项[^2]。 #### 同步运行模式下的基础代码结构 当编写 Python 脚本时,通常需要定义一个同步运行入口以便启动和关闭浏览器实例。以下是典型的代码片段展示如何实现这一点: ```python from playwright.sync_api import sync_playwright def run(playwright): browser = playwright.chromium.launch(headless=False) page = browser.new_page() page.goto("https://example.com") print(page.title()) browser.close() with sync_playwright() as playwright: run(playwright) ``` 上述脚本展示了如何加载 Chromium 浏览器、打开新页面访问指定 URL 并打印标题最后关闭浏览器的过程[^3]。 #### 支持多种浏览器内核 值得注意的是,尽管这里演示了 Chromium 的例子,但实际上 Playwright 提供对多个主流浏览器的支持(如 Firefox 和 WebKit),这些浏览器都共享类似的 API 设计理念,使得切换不同平台变得简单直观[^4]。 ### 结论 综上所述,无论是针对常规网站还是特殊类型的桌面应用,Playwright 都提供了灵活而高效的解决方案来进行自动化测试或者日常任务处理。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值