预测模型-阿里天池竞赛-二手车交易价格预测
简介
本仓库包含了一个关于预测二手车交易价格的模型,该模型来自于阿里天池竞赛。竞赛的任务是基于提供的数据集预测二手车的交易价格,数据集包含超过40万条记录,具有31列变量信息,其中15列为匿名变量。
数据集
数据集被分为两部分,其中15万条记录作为训练集,5万条记录作为测试集B。竞赛要求参与者通过数据挖掘技术对训练集进行分析,并在测试集B上评估模型的准确性。
评测标准
模型的评估采用平均绝对误差(MAE)作为标准,MAE值越小,说明模型的预测越准确。
文件内容
压缩包中包含以下两个文件:
-
竞赛-分类预测:该文件记录了数据集的处理流程以及使用xgb、lgb以及xgb、lgb融合方法进行预测的过程。最终模型在测试集上的MAE为689.09。
-
竞赛-可视化分析:本文件对训练集和测试集的缺失值分布进行了可视化分析,并对数据进行了分布拟合,发现数据服从无界约翰逊分布。此外,通过相关性分析,研究了数值型特征与价格之间的关系,绘制了相关性图,发现价格与v_3属性呈现高度负相关,而与v_0、v_8、v_12呈现高度正相关。散点图进一步揭示了v_12与v_8以及v_1与v_6之间的线性关系。还对每个特征的平均价格进行了可视化分析,观察不同特征取值对平均价格的影响。
注意事项
在使用本资源时,请遵守相关竞赛规则和数据使用规定。本仓库的资源仅供学习和研究使用。
此文档旨在帮助理解仓库中的资源和竞赛背景,为相关研究和进一步的开发提供参考。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



