【机器学习】【数据处理】Pandas 处理缺失值

本文探讨了在处理数据集时遇到的缺失值问题,主要介绍了Pandas库中的两种处理方法:用掩码表示和用标签值表示。针对每种方法的优缺点进行了说明,并详细阐述了Pandas中None和NaN的区别。此外,还讲解了Pandas提供的isnull(), notnull(), dropna()和fillna()等函数的使用,用于检测、删除和填充缺失值的操作。" 133002103,20039232,单片机内核定时器timer_list详解及源码示例,"['单片机开发', '内核定时器', '硬件资源']

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目前很多流行的数据集都会存在数据缺失的现象。

一般我们在用Pandas处理缺失值的方法有两种:

           1.用覆盖全局的掩码来表示缺失值.(用布尔类型来代替原先数据/用0或1来表示)

           2.用一个标签值来表示缺失值.(用一个具体的自定义的数据来表示,如-9999.  或用None或NaN)

1.缺失值

具体使用哪种方法还需要看具体情况:

                            1.用掩码来处理会额外构造一个布尔数组,会增加存储

                            2.标签值方法缩小了可以被表示的有效值的范围,会增加额外的计算逻辑。而且NaN也不                                                               能够表示所有数据类型。

Pandas的缺失值:1.Python对象类型的缺失值None(Python中不能将None与整数相加)

                        &n

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值