python为什么会出现nan_NaN为何会凭空产生?

在项目中,作者遇到Python数据处理时出现'nan'错误,尝试过滤负值工作经验并用中位数替换。经过排查,发现不是原始数据包含'nan',而是matplotlib库存在bug导致运行时报错。更新matplotlib库后问题解决。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在做项目时遇到了一个错误:

#过滤出正常的工作经验值数据集合不正常的工作经验布尔值

dfExp=data.query('Experience>0')

negExp=data.Experience<0

mylist=data.loc[negExp]['ID'].tolist()

#对每一个工作经验为负的样本,用同年龄和教育程度的工作经验均值代替

for id in mylist:

age=data.query('ID==@id').Age.tolist()[0]

education=data.query('ID==@id').Education.tolist()[0]

df_filtered=dfExp.query('Age==@age and Education==@education')

exp=df_filtered['Experience'].median()

if exp is not np.nan:

exp=data.Experience.median()

data.loc[data.query('ID==@id').index,'Experience']=exp

print(data.Experience.describe())

sns.distplot(data.Experience)

上面这一段代码,目的是通过for循环把数据下Experience(工作经验)列中的异常值,即负值进行清洗,因为工作经验与年龄和受教育程度是高度相关的,所以把工作经验为负的值转化为相同年龄和受教育程度的中位数值。

即如果工作经验为-1,而年龄为30、受教育程度毕业生,那就把年龄为30且教育程度为毕业生的这些人的中位数,比如5,赋值给此条数据,用5去代替-1。

可是运行完这个数据后却报错了cannot convert float NaN to integer

大意:不能把浮点类型的空值NaN转换成整数。

百思不得其解

首先我比较奇怪难道数据一开始存在NaN么?

data[data['Experience'].isnull()]

于是输入了上面代码,发现对工作经验列进行处理之前数据中是没有空值存在的,显然这些空值是在数据进行处理后产生的。

于是对于数据代码我也反复确认了,发现其中并没有什么有问题的地方。

于是问了度娘:

原来是安装的matplotlib有bug存在,在Annoconda中更显一下就好了。

pip install --upgrade matplotlib_venn

安装成功后重启notebook,果然不再报错!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值