一、赛题分析
1. 认识数据(赛题说明)
2. 了解比赛的背景
分类问题还是回归问题,以及评分函数
3. 对比赛数据做EDA
- 数据分析
- 缺失值分析
- 特征值分析
- 是否有单调特征列(单调的特征列很大可能是时间)
- 特征nunique分布
- 出现在测试集中的community,但是在训练集中数量较少
- 统计特征值出现频次大于100的特征
- Label分布
- 不同的特征值的样本的label的分布
【作业要求】
每一步都要认真完成,附上代码,最终效果截图
分类问题还是回归问题,以及评分函数
【作业要求】
每一步都要认真完成,附上代码,最终效果截图