python读取xlsx

通过pandas库可读取xlsx文件,读取方式为

import pandas as pd


data = pd.read_csv('./data.xlsx')

但pandas读取xlsx文件需要xlrd库,未安装则会提示缺少库文件,另外,如果xlrd库版本过高,则会提示

xlrd.biffh.XLRDError: Excel xlsx file; not supported

需要将xlrd库降至1.2.0版本。

### 使用Python读取XLSX文件 为了实现这一目标,可以采用两种主要方法:一种是利用 `pandas` 库来加载Excel文件并创建DataFrame对象;另一种则是通过专门处理Excel文档的 `openpyxl` 库来进行操作。 #### 方法一:使用Pandas库读取XLSX文件 由于Pandas能够支持多种数据源格式,在处理Excel文件时需要额外安装依赖项以确保功能正常运作。对于`.xlsx`类型的文件来说,通常会建议先安装`openpyxl`模块作为解析器之一[^3]。下面是一个简单的例子展示如何借助Pandas读入Excel表格: ```python import pandas as pd # 加载excel文件到dataframe中 df = pd.read_excel('test.xlsx', engine='openpyxl') # 显示前几行的数据预览 print(df.head()) ``` 这段代码首先导入了必要的包——即`pandas`,接着调用了`read_excel()`函数指定要打开的目标路径以及所使用的引擎参数设置为`'openpyxl'`,最后打印出了新生成的DataFrame头部信息以便查看内容概貌。 #### 方法二:使用OpenPyXL库读取XLSX文件 如果更倾向于直接操控工作簿结构而不必转换成DataFrame形式,则可以选择应用`openpyxl`库完成相同任务。这里给出一段示范性的脚本用于说明具体做法: ```python from openpyxl import load_workbook # 打开现有的workbook wb = load_workbook(filename="test.xlsx") # 获取活动的工作表 ws = wb.active for row in ws.iter_rows(values_only=True): print(row) ``` 此段程序先是引入了来自`openpyxl`中的`load_workbook`函数用来装载已存在的Excel文件实例化Workbook类的对象。之后选取默认激活的那个Sheet页,并遍历其所有的行记录逐条输出显示出来。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值