Python读取二进制,HTML,XML格式存储的Excel文件

本文介绍了如何使用Python读取二进制、HTML和XML格式的Excel文件。通过示例代码展示了如何将读取操作封装成函数,包括pandas的read_excel用于二进制文件,read_html用于HTML文件,以及正则表达式解析XML文件的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

关注RPA请访问网站:
www.i-search.com.cn
学Python,用RPA,欢迎下载使用
https://www.i-search.com.cn/?from=csdn

前言
RPA设计器版本:2020.2

Python读取三种不同存储格式Excel文件
Excel文件的存储格式有多种,有我们平常公认的二进制格式,也有HTML格式,还有XML格式的等。

目前,小编接触到RPA项目的Excel文件格式主要是上述说的三种格式(二进制,HTML,XML)

这里需要注意的是:RPA设计器2020.2只支持二进制格式的Excel文件读取

Python读取二进制类型的Excel文件并返回DataFrame对象
这里我直接将重新读取Excel的操作封装成函数放在一系列函数使用,也可以使用RPA设计器自带的读取Excel组件。

def get_data_from_binary_excel(file_path):
“”"
从 binary 二进制格式的 excel 中获取数据
:param file_path:
:return: DataFrame
“”"
# 读取Excel 使用 pandas 读取二进制文件 excel
pd_df = pd.read_excel(io=file_path)
# 填充 NaN 将 nan 值用空字符串替换 df = rpa_pandas.fillna(df=pd_df)
df = pd_df.fillna(’’)
return df
Python读取HTML类型的Excel文件并返回DataFrame对象
这里我直接将重新读取Excel的操作封装成函数放在 一系列函数 中使用

def get_data_from_html_excel

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值