关注RPA请访问网站:
www.i-search.com.cn
学Python,用RPA,欢迎下载使用
https://www.i-search.com.cn/?from=csdn
前言
RPA设计器版本:2020.2
Python读取三种不同存储格式Excel文件
Excel文件的存储格式有多种,有我们平常公认的二进制格式,也有HTML格式,还有XML格式的等。
目前,小编接触到RPA项目的Excel文件格式主要是上述说的三种格式(二进制,HTML,XML)
这里需要注意的是:RPA设计器2020.2只支持二进制格式的Excel文件读取
Python读取二进制类型的Excel文件并返回DataFrame对象
这里我直接将重新读取Excel的操作封装成函数放在一系列函数使用,也可以使用RPA设计器自带的读取Excel组件。
def get_data_from_binary_excel(file_path):
“”"
从 binary 二进制格式的 excel 中获取数据
:param file_path:
:return: DataFrame
“”"
# 读取Excel 使用 pandas 读取二进制文件 excel
pd_df = pd.read_excel(io=file_path)
# 填充 NaN 将 nan 值用空字符串替换 df = rpa_pandas.fillna(df=pd_df)
df = pd_df.fillna(’’)
return df
Python读取HTML类型的Excel文件并返回DataFrame对象
这里我直接将重新读取Excel的操作封装成函数放在 一系列函数 中使用
def get_data_from_html_excel