提升自定义模型性能:二手车拍卖价格预测实战
1. 项目背景与目标
在二手车拍卖价格预测项目中,初始的线性回归模型采用 scikit - learn 构建,但未能达到业务目标,即销售价格的均方根误差(RMSE)需控制在 2000 美元以内,且不能使用 Manheim Market Report(MMR)特征。项目提供了已清理的 CSV 数据集,以及构建线性回归模型的代码和数据划分情况,还包含一个未使用的测试数据集用于验证最终模型性能。我们的任务是通过特征工程和超参数调优来提升模型性能。
数据集包含 13 列,具体信息如下表所示:
| 列名 | 列类型 | 字段值说明 |
| — | — | — |
| year | Integer | 车辆制造年份 |
| make | String | 车辆品牌 |
| model | String | 车辆特定版本或变体 |
| trim | String | 车辆型号的特定版本或变体 |
| body | String | 车辆车身样式(如轿车) |
| transmission | String | 自动或手动变速器 |
| state | String | 车辆销售所在州 |
| condition | Float | 车辆状况评分(0 到 5) |
| odometer | Integer | 销售时的里程表读数 |
| color | String | 车辆颜色 |
| interior | String | 车内颜色 |
| mmr | Float | Manheim Market Report 定价 |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



