pandas神坑：如果列有NAN，则默认给数据转换为float类型

最新推荐文章于 2024-05-08 23:33:54 发布

原创最新推荐文章于 2024-05-08 23:33:54 发布 · 6.9k 阅读

18 ·

CC 4.0 BY-SA版权

python 同时被 3 个专栏收录

29 篇文章

订阅专栏

pandas

3 篇文章

订阅专栏

excel

2 篇文章

订阅专栏

本文探讨了使用pandas读取Excel文件时遇到的空值处理问题，详细介绍了如何将空值（NaN）替换为特定值，以及如何在读取文件时指定列的数据类型，避免类型转换错误。

部署运行你感兴趣的模型镜像

data = pandas.read_excel(file)

结果读完一个excel，我所有为空的单元格，他全部给我按nan算了，好无语。

然后debug去查看这个nan，居然还是float类型，为什么不用字符串呢？
所以我们想把对应nan的数据改为自己想要的数据，就要操作一番。

第一种：

data.fillna('', inplace=True)

直接替换读取到的数据中为空的数据为空字符串

第二种：

在读取文件前，直接指定对应列的类型

dtype_dic= {'音乐类型': str, '专辑名称' : str}

当然，如果全部都要用字符串的话，可以这样：

header = pd.read_excel("your_file.csv", nrows=1) # 仅取第一行的标题
col_str_dic = {column:str for column in list(header)}
df = pd.read_excel(file, dtype=col_str_dic)

然后在读取文件的时候指定这个类型

df = pd.read_excel(file, dtype = dtype_dic)

参考自：https://stackoverflow.com/questions/13250046/how-to-keep-leading-zeros-in-a-column-when-reading-csv-with-pandas

您可能感兴趣的与本文相关的镜像

ACE-Step

音乐合成

ACE-Step

ACE-Step是由中国团队阶跃星辰（StepFun）与ACE Studio联手打造的开源音乐生成模型。它拥有3.5B参数量，支持快速高质量生成、强可控性和易于拓展的特点。最厉害的是，它可以生成多种语言的歌曲，包括但不限于中文、英文、日文等19种语言