Python读取excel数据后保存数据再次提取

该博客介绍了如何使用Python的xlrd库从Excel文件中读取数据,并将数据存储为字典列表。示例代码展示了如何获取指定工作表的数据,包括上班时间、下班时间和预期结果等字段,并将其保存在字典中,最后将这些字典添加到列表中供后续使用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

首先看一下excel数据

1.从excel读取数据并保存,使用的是xlrd库,使用前先导入

def sign_time():
    data = xlrd.open_workbook("F:\\selenium\\IRS\\data\\testexcel\\kq.xls")  # 打开excel,路径注意是双斜杠
    sheet = data.sheet_by_name("Sheet1")  # 通过sheet页名称来获取sheet工作表
    rowNum = sheet.nrows  # 获取总行数
    # colNum = sheet.ncols  # 获取总列数
    # 创建列表用来存储数据
    list = []
    # 开始取excel每行的值,注意行数是从0开始,因此循环时,需要总行数-1,否则会list index out of range
    for i in range(1, rowNum):
        # 创建空字典,用来保存数据
        data_dict = {}
        # 将读取到的值和对应的表头名组成键值对,存入空字典 data_dict 中
        data_dict['上班时间'] = sheet.cell(i, 0).value
        data_dict['下班时间'] = sheet.cell(i, 1).value
        data_dict['预期结果'] = sheet.cell(i, 2).value
        # 将保存了测试数据的字典添加进列表list中
        list.append(data_dict)
    return list

2.读取上面获取的list中的数据(列表中嵌套字典)

def test_cell(sign_time):
    for i in range(len(sign_time)):
        print(i, sign_time[i]['上班时间'])

 

### 使用 Pandas 和 Openpyxl 读取 Excel 文件 Pandas 是一种强大的数据分析工具库,能够轻松处理 Excel 数据。以下是通过 Pandas 和 Openpyxl 实现从 Excel 文件中读取提取数据的具体方法。 #### 方法一:使用 Pandas 的 `read_excel` 函数 Pandas 提供了一个简单易用的函数 `pd.read_excel()` 来加载 Excel 文件的数据到 DataFrame 中[^1]。下面是一些常见的用法: ```python import pandas as pd # 基本读取方式,默认会读取第一个 sheet df = pd.read_excel('example.xlsx') # 指定特定的工作表名 df_specific_sheet = pd.read_excel('example.xlsx', sheet_name='Sheet2') # 同时读取多个工作表并以字典形式返回 dfs_dict = pd.read_excel('example.xlsx', sheet_name=['Sheet1', 'Sheet2']) # 如果需要按索引号读取工作表 dfs_indexed = pd.read_excel('example.xlsx', sheet_name=[0, 1]) # 混合指定工作表名称和索引号 mixed_dfs = pd.read_excel('example.xlsx', sheet_name=[0, 'Sheet2']) ``` 上述代码展示了多种读取 Excel 工作簿的方式,包括默认读取首个工作表、指定单个工作表以及批量读取多个工作表的情况[^3]。 #### 方法二:使用 Openpyxl 处理更复杂的场景 Openpyxl 是专门用于操作 `.xlsx` 文件的一个 Python 库。它提供了对单元格级别的访问能力,在某些情况下可能更适合复杂需求。例如修改样式或者写入新数据等。 安装命令如下: ```bash pip install openpyxl ``` 下面是利用 Openpyxl 进行基本数据读写的例子: ```python from openpyxl import load_workbook wb = load_workbook(filename="example.xlsx") ws = wb['Sheet1'] for row in ws.iter_rows(values_only=True): print(row) ``` 此段脚本先载入整个工作薄对象 (`Workbook`) ,再选取目标 Sheet 对象(`Worksheet`) 并迭代打印每一行的内容[^2]。 两种技术各有优劣,选择取决于具体应用场景和个人偏好。对于大多数简单的分析任务来说,Pandas 更加方便快捷;而对于涉及更多细节控制的任务,则可以考虑采用 Openpyxl。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值