data = pandas.read_excel(file)
结果读完一个excel,我所有为空的单元格,他全部给我按nan算了,好无语。
然后debug去查看这个nan,居然还是float类型,为什么不用字符串呢?
所以我们想把对应nan的数据改为自己想要的数据,就要操作一番。
第一种:
data.fillna('', inplace=True)
直接替换读取到的数据中为空的数据为空字符串
第二种:
在读取文件前,直接指定对应列的类型
dtype_dic= {'音乐类型': str, '专辑名称' : str}
当然,如果全部都要用字符串的话,可以这样:
header = pd.read_excel("your_file.csv", nrows=1) # 仅取第一行的标题
col_str_dic = {column:str for column in list(header)}
df = pd.read_excel(file, dtype=col_str_dic)
然后在读取文件的时候指定这个类型
df = pd.read_excel(file, dtype = dtype_dic)

本文探讨了使用pandas读取Excel文件时遇到的空值处理问题,详细介绍了如何将空值(NaN)替换为特定值,以及如何在读取文件时指定列的数据类型,避免类型转换错误。
2633

被折叠的 条评论
为什么被折叠?



