Black_Friday数据分析--缺失值

本文介绍了一个关于黑色星期五零售商店销售记录的数据集,包含55万个样本,涉及多种变量。数据集来源于AnalyticsVidhya竞赛。文章详细描述了使用Pandas进行数据导入的过程,并对数据集中存在的缺失值进行了深入分析与处理,特别是针对Product_Category_2和Product_Category_3两个字段的缺失值,提出了具体的填充策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、数据集简介

黑色星期五---通过消费者行为研究销售

数据集包含55万个零售商店在黑色星期五的销售记录,它包含不同种类的变量或数字或分类。它包含缺失的值。数据集来自Analytics Vidhya主办的竞赛。

二、数据导入

使用panda将数据导入为数据框类型,为 bf

 

三、处理缺失值

1.检查是否存在缺失值

Product_Category_2和Product_Category_3返回值为True,只有该2个字段存在缺失值。而User_ID 和Product_ID不存在缺失值,数据较为完整。


2.计算缺失值的比率

 

Product_Category_3的缺失值较高,约达70%

3.缺失值填充

Product_Category的取值为数字,可理解为表示商品属于该类别的程度(0-18),使用 0 填充。并检查是否替换成功。

缺失值处理完毕

 

未完待续。。。。。。

 

 

 

 

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值