
Datawhale数据挖掘
阿光light
这个作者很懒,什么都没留下…
展开
-
Task03特征工程
特征工程 跟着直播课走一遍练习了,最近事情可太多了T_T 首先利用箱线图来清洗异常值。代码如下所示: def outliers_proc(data,col_name,scale=3): # 用于清洗异常值,默认用box_plot(scale=3)进行清洗 # param data:接收pandas数据格式 # param col_name:pandas列名 # pa...原创 2020-03-28 18:38:58 · 173 阅读 · 0 评论 -
Datawhale数据挖掘Task2-数据分析
二手车交易价格预测 赛题理解 根据二手车的各项指标,预测二手车交易时的价格,典型的回归问题。给定的特征共有30个。 数据分析用到的相关包 训练集包含150000样本,测试集包含50000样本。 Pandas Pandas可以用来读取数据,并对数据进行处理。 首先对训练集进行缺失值处理。 Pandas里读取数据得到DataFrame之后,可以用以下这条语句来检查DataFrame中是否存在Null值...原创 2020-03-24 17:20:56 · 348 阅读 · 0 评论