python+selenium获取分页表格数据并导入excel中

最新推荐文章于 2024-10-14 09:25:24 发布

原创

最新推荐文章于 2024-10-14 09:25:24 发布 · 3.2k 阅读

43 ·

CC 4.0 BY-SA版权

文章标签：

#python #selenium #数据分析

本文介绍了一种使用Selenium和xlsxwriter库从网页抓取表格数据并将其保存到Excel文件的方法。通过定位table标签和其子标签，实现了数据的批量抓取。同时，通过输入页码实现分页数据的获取。

1.准备工作：
安装环境：python3，selenium库，xlsxwriter库，chorme浏览器，chormedriver(具体安装步骤自行百度)
2.开始编写代码
首先导入我们必须要的库：

from selenium import webdriver
import xlsxwriter
from selenium.webdriver.common.keys import Keys

接着编写一个打开网址的方法：

def OpenChorme(url):
    chorm_drive = r'E:\python\chromedriver.exe' # 此处是我chormedriver放的位置
    driver = webdriver.Chrome(executable_path=chorm_drive)
    driver.get(url) # url你选择要打开的网址
    return driver

我要打开的一个网站是我们这里内网的一个网址，就不给出来了。我们要抓取网站上的表格数据如下图：在这里插入图片描述
通过chorme的开发者工具，我们可以定位到该table标签的 id 为 list然后再查看其包含的子标签tbody>tr
其中，每一行tr标签又包含列td每一行tr标签里的子标签td就包含着我们需要抓取的数据，那么我们就可以通过selenium的定位方法去定位标签，获取标签里的数据。
接下来，我们写一个获取所有表格数据的方法：

def find_all_data(driver):
    dat = []
    lst = []
    # 通过css选择

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

杨佳啊

关注关注

6
点赞
踩
43

收藏

觉得还不错? 一键收藏
4
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

使用selenium登录网站并爬取数据保存到excel

zbguolei的专栏

11-23

3871

使用selenium模拟登录到网站后，利用requests爬取数据，用bs4解析数据，用xlwt保存到excel。自定义了2个函数：getData()用于获取数据，使用for循环获取多个页面的数据，解析后的数据保存到列表中；saveData(datalist, savepath)用于保存数据，参数datalist是保存的数据，参数savepath是保存的路径，写入数据时使用了双重循环。 from selenium import webdriver import time import request

Selenium学习三——利用Python爬取网页表格数据并存到excel

热门推荐

yxStory的博客

09-25

2万+

利用Python爬取网页表格数据并存到excel 1、具体要求：读取教务系统上自己的成绩单，并保存到本地的excel中 2、技术要求：利用Selenium+Python获取网页，自动登陆并操作到成绩单页面通过xlwt模块，将表格保存到本地excel （其中xlwt模块通过cmd打开命令框，输入pip install xlwt下载） 3、主要代码： #创

4 条评论您还未登录，请先登录后发表或查看评论

python读取excel的常用操作

日常积累的技术分享

05-26

3534

在自动化测试中，我们常常会使用到excel管理测试参数。本文主要介绍excel的常用操作。

selenium获取网页翻页表格内容并存入 excel

qq_15907907的博客

12-30

3392

#coding:utf-8 from selenium.webdriver.common.by import By #引入判断元素加载模块 from selenium.webdriver.support.ui import WebDriverWait #引入判断元素加载模块 from selenium.webdriver.support import expected_conditio...

Python爬取网页数据并写入Excel

weixin_68443051的博客

03-28

2373

ChromeDriver下载链接：https://registry.npmmirror.com/binary.html?path=chromedriver/本例是从Excel表从读取数据，运用到网页中进行搜索，再将结果写入Excel表中。这里要先下载与Chrome版本相同的chromedriver（版本要相同！下载好后，将chromedriver路径正确配置在环境变量中。刚才爬了一些数据，分享一下代码。

python3+selenium 抓取网页多个表格数据，并导入execl中

FengNingXueChen的博客

02-18

4422

1. 首先我需要抓取数据的网址是： "https://mtj.baidu.com/data/mobile/device" 2. 打开浏览器，输入网址，是这个页面 3. 我想要抓取，品牌，机型，系统，分辨率，联网右边的表格 4. 使用 pycharm IDE,下载 selenium模块 pip install selenium(请在py...

数据驱动测试秘籍：Python+Selenium数据提取与应用实战

通过将测试数据存储在外部数据源中，如Excel表、数据库或配置文件，测试脚本可以独立于测试数据运行，显著提高测试效率和覆盖率。 ## 1.1 数据驱动测试的核心思想数据驱动测试的核心在于“数据”的分离和重用。...

Selenium学习四——利用Python爬取网页多个页面的表格数据并存到已有的excel中

yxStory的博客

09-26

1万+

利用Python爬取网页多个页面的表格数据并存到已有的excel中 1、具体要求获取牛客网->题库->在线编程->剑指Offer网页，获取表格中的全部题目，保存到本地excel中 2、技术要求利用Selenium+Python获取网页，操作到table页面通过xlwt、xlrd、xlutils模块，将表格保存到本地excel xlwt：写入

selenium 获取网页表格单元格数据并保存到excel

最新发布

12-29

### 使用 Python 和 Selenium 抓取网页表格数据并导出至 Excel 为了实现这一目标，可以按照以下方法编写代码： #### 导入库首先需要导入必要的库来处理浏览器自动化以及Excel操作。 ```python import time from ...

Python+selenium 自动化-读取excel记录的脚本执行登陆操作实战演示-附件资源

03-02

Python+selenium 自动化-读取excel记录的脚本执行登陆操作实战演示-附件资源

Python 实现二叉树前序，中序，后序，零基础也能看得懂

m0_67621628的博客

03-17

1303

self.element = element self.l_child = l_child self.r_child = r_child class Tree(object): “”“树类”"" def init(self): self.root = Node() self.queue = [] def add_node(self, element): “”“为树添加节点”"" node = Node(element) 如果树是空的，则对根节点赋值 if self.root.element == -1: s

Python+selenium 【第八章】封装excel类，封装test_data类读取测试元素信息

罐装七喜的博客

01-06

709

Python+selenium 【第八章】封装excel类，封装test_data类读取测试元素信息使用xlrd3读取数据示例代码封装excel类示例代码代码图示封装element_excel_data类代码图示总结代码博客园地址题记：本章节主要讲述的excel的封装，以及测试元素信息的读取，来适配框架的一些操作使用xlrd3读取数据由于我们的数据是存储到excel里面的,所以在此我们需要封装一个读取excel的数据的方法读取baidu_page.xls文件中的内容 excel图示示例代码

使用Selenium爬取某网站体育数据到Excel

2301_76728828的博客

10-14

729

在当今数据驱动的时代，体育数据分析已成为研究和理解运动表现的重要工具。特别是在篮球领域，球员的统计数据能够反映他们在比赛中的表现。本文将介绍一个利用Python的Selenium库抓取NBA球员统计数据的项目。该项目不仅能够从网页中提取所需信息，还能将数据保存为Excel文件，以便后续分析和使用。通过使用Selenium库，本项目成功地实现了从NBA官方网站抓取球员统计数据的功能。该系统不仅可以提取多页数据，还能将数据整理并保存为Excel格式，便于后续分析。

Python +Selenium 数据驱动 excel文件读写

唯柳独斓

08-09

2949

在测试过程中我们经常会遇到需要大量测试数据进行支持的时候，如添加批量数据，多用户登录等。为此我们需要用excel文件来准备大量数据，这里就涉及到了 excel文件读取的读取：我们直接贴代码吧！代码中有详细的说明 class ExcelReader: """ 读取excel文件中的内容。返回list。如： excel中内容为： | A | B ...

python+selenium+excel自动化测试，单元格格式处理

weixin_49797392的博客

03-14

474

python+selenium+excel自动化测试，单元格格式处理

python+selenium 使用excel实现关键字封装

zhujuntangxiaojuan的博客

07-05

534

from util.excel_util import ExcelUtil from keywordselenium.actiomMethod import ActionMethod excel_path = r'D:\PycharmProjects\2020study\config\keyword.xls' class KeyWordCase(object): def run_main(self): self.action_method = ActionMethod() .

Python+Selenium基础篇之17 - 爬取的数据导出excel表格

伟爵社的博客

04-01

2952

这章我们介绍一下自动化获取到的数据如何导出excel表格相关代码如下： # coding=utf-8 import xlwt import time from selenium import webdriver driver = webdriver.Chrome() driver.get('https://www.baidu.com/') time.sleep(1) workbook = xlwt.Workbook(encoding='utf-8') #创建workbook对象 worksheet =

python3.6+selenium使用Excel进行数据驱动测试

Marry_Ma的博客

07-25

1420

以下是完整的实例代码，但是遗憾的是没有实现跳过第一行数据的测试，后续再继续研究，如果有已经实现的朋友，可以评论或者私信告诉我如果更改。希望我们共同进步。谢谢！环境准备： 1.首先安装openpyxl库，使用命令：pip install openpyxl 测试数据的准备： 1.本子磁盘D：DataDriverTesting新建一个test.xlsx,工作表名为：“搜索数据表”，内容如图所示：以...

Python3+Selenium+unittest+excel Web自动化测试实战

公众号：【伤心的辣条】

10-23

868

项目的结构如下： POM是什么？ Page Object Model (POM) 直译为“页面对象模型”，这种设计模式旨在为每个待测试的页面创建一个页面对象(class)，将那些繁琐的定位操作封装到这个页面对象中，只对外提供必要的操作接口。 POM模型的优点 a. 把web ui对象从测试脚本分离，业务代码和测试脚本分离。 b. 每一个页面对应一个页面类，页面的元素写到这个页面类中。 c. 页面类主要包括该页面的元素定位，和这些元素相关的业务操作代码封装的方法。 d. 代码复用，从而减少测试脚本代码量。