汽车拍卖价格预测:特征工程、超参数调优与Keras模型改进
1. 特征工程与模型性能提升
在处理汽车拍卖价格预测问题时,首先进行了一系列特征工程操作以提升模型性能。
1.1 创建新特征
创建了新列 model_trim ,它由 model 和 trim 列的值拼接而成,并将其转换为小写,以避免大小写差异导致的特征值不同。同样,对 color 和 interior 特征也进行了类似的特征交叉操作,创建了 color_interior 列。
# 假设 df 是数据集
df['model_trim'] = df['model'] + '_' + df['trim']
df['model_trim'] = df['model_trim'].str.lower()
df['color_interior'] = df['color_interior'].str.lower()
1.2 更新分类特征列表
将新创建的特征交叉列添加到分类特征列表 categorical_columns 中。
categorical_columns = ['make', 'model', 'trim', 'model_trim', 'body',
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



