Pandas -- 遍历excel表格的方式

本文通过实际代码演示了在Python中使用Pandas库处理Excel文件时,itertuples与iterrows两种不同数据迭代方法的效率差异,并得出itertuples方法在性能上更胜一筹的结论。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

代码

  • 一万行测试
# -*- coding: utf-8 -*-
# @Author   : zbz

import time
import pandas as pd

curr = lambda: time.time()
file = "./files/person.xlsx"
df = pd.DataFrame(pd.read_excel(file, engine="openpyxl"))

begin = curr()
cols = df.columns.tolist()
for val in df.itertuples(index=False):
    vals = list(val)
    docu = {k: v for k, v in zip(cols, vals)}
print("{} cons {}".format("itertuples".ljust(20), curr() - begin))

begin = curr()
for i, ser in df.iterrows():
    docu = dict(ser)
print("{} cons {}".format("iterrows".ljust(20), curr() - begin))

结果

在这里插入图片描述

结论

  • 使用itertuples方法要快的多
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值