Pandas -- 遍历excel表格的方式

原创已于 2022-02-21 14:29:46 修改 · 6.5k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#python #数据分析 #数据挖掘

于 2022-01-17 17:07:38 首次发布

pandas 专栏收录该内容

2 篇文章

订阅专栏

本文通过实际代码演示了在Python中使用Pandas库处理Excel文件时，itertuples与iterrows两种不同数据迭代方法的效率差异，并得出itertuples方法在性能上更胜一筹的结论。

部署运行你感兴趣的模型镜像

代码

一万行测试

# -*- coding: utf-8 -*-
# @Author   : zbz

import time
import pandas as pd

curr = lambda: time.time()
file = "./files/person.xlsx"
df = pd.DataFrame(pd.read_excel(file, engine="openpyxl"))

begin = curr()
cols = df.columns.tolist()
for val in df.itertuples(index=False):
    vals = list(val)
    docu = {k: v for k, v in zip(cols, vals)}
print("{} cons {}".format("itertuples".ljust(20), curr() - begin))

begin = curr()
for i, ser in df.iterrows():
    docu = dict(ser)
print("{} cons {}".format("iterrows".ljust(20), curr() - begin))

结果

在这里插入图片描述

结论

使用itertuples方法要快的多

您可能感兴趣的与本文相关的镜像

Python3.9

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

是大嘟嘟呀

关注关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

python数据分析基础007 -利用pandas带你玩转excel表格（中上篇）

苏凉.py的博客

04-07

1万+

利用pandas带你玩转excel，建议收藏！！

数十万数据Excel数据不好处理怎么办？几行Python搞定

pyfun的博客

07-04

1226

电商行业，每月有上百万条订单发货数据需要与仓库的数据进行核对计算，涉及到数据计算，筛选，匹配等步骤，用excel表超级卡，并且经常卡死。这时如果你会Python，十几行代码就可以搞定。这里需要两个Python库，一个是os库，一个是pandas库。 os库 os是Python内置库，不需要额外安装，只要用import导入就可以用了。os模块封装了常见的文件和目录操作，利用它可以轻松的对系统上的目录和文件进行各种操作，比如获取当前目录、列举当前文件夹中的所有文件和文件夹、判断文件或目录是否存在、删除文件

2 条评论您还未登录，请先登录后发表或查看评论

2 条评论

努力学习的新生代农民工 2022.01.18
[face]emoji:015.png[/face][face]emoji:062.png[/face][face]emoji:062.png[/face]
- 是大嘟嘟呀回复努力学习的新生代农民工 2022.01.18
  [face]emoji:007.png[/face]