目录
特征工程(Feature Engineering)
其本质上是一项工程活动,他目的是最大限度地从原始数据中提取特征以供算法和模型使用
1 特征工程重要性
01 特征越好,灵活性越强
(允许选择不复杂的模型,运行速度快,可以更好的理解和维护)
02 特征越好,模型越简单
(不需要花费太多的时间去寻找最优参数解,大大降低了模型的复杂度)
03 特征越好,性能越出色(最终的目的)
(包括模型的效果、执行的效率、模型的可解释性)
2 特征工程内容包括
数据处理
特征选择
维度压缩
3 数据处理
数据处理:量纲不一、虚拟变量、缺失值填充
详细案例见:https://blog.youkuaiyun.com/qq_36327687/article/details/84993729