Python读取Excel非常慢，应该如何优化？

最新推荐文章于 2025-10-27 17:00:51 发布

原创最新推荐文章于 2025-10-27 17:00:51 发布 · 6.1k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#excel #数据分析 #数据挖掘 #python

python 专栏收录该内容

87 篇文章

订阅专栏

文章提出了几点提升Python读取Excel文件效率的方法，包括使用openpyxl库代替xlrd，分块读取文件以管理内存，将Excel存储在SSD上加速I/O，以及仅处理必要列和使用向量化运算来避免不必要的计算。此外，还建议考虑升级Python版本、利用多线程和C/C++扩展来进一步优化。

部署运行你感兴趣的模型镜像

Python读取Excel文件时常常遇到性能不理想的情况,特别是在处理较大的Excel文件时。这里总结了几点优化措施,帮助提高Python读取Excel的效率。

1. Python的Excel处理包主要依赖第三方库,效率会略低于R内置的Excel处理功能。可以尝试以下优化措施:
- 使用openpyxl而不是xlrd,openpyxl是目前性能最优的Excel处理库。
- 安装Cython,并重新编译openpyxl,可以显著提高性能。
- 注意使用reads_excel()而不是read_excel()方法。

2. Excel文件太大,占用内存过多。可以尝试:
- 指定nrows参数只读取文件的部分行
- 使用chunksize参数分块读取Excel,释放内存
- 将Excel进行分sheet存储,按sheet逐个读取

3. I/O读写速度慢。可以尝试:
- 将Excel文件放在SSD而非HDD,提高读写速度
- 减少文件读取次数,可以先加载到内存/数据库中
- 检查其他I/O相关设置,如buffer size等

4. 不必要的数据处理。可以尝试:
- 仅读取实际需要的列,省略无关列
- 避免重复读取/计算相同数据
- vector化运算而不是for循环

除此之外,也可以尝试其他一些优化措施:
- 升级Python版本,新版本的性能更优
- 使用多线程读取Excel
- C/C++扩展替代Python实现热点逻辑

您可能感兴趣的与本文相关的镜像

Python3.9

Python3.9

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

devid008 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。