在工业应用中,feature 比算法重要,数据比 feature 重要,有很多 kaggle 参赛者分享经验时也是说 feature engineering 很重要,今天来写一写特征工程相关的。
本文结构
- Feature Engineering 是什么
- 有什么用
- 怎么用
- 实际应用
1. 是什么
先用例子来直观地了解一下
例如要分析声音,直接拿来数据,是什么都学不到的,需要进行 fourier 变换
例如分析图片,判断这个图片是不是苹果,可以选择 形状,颜色分布,边 来作为feature
特征工程就是选择一些表示典型特征的数据,来替代原始数据作为模型的输入,进而得到比较好的输出效果。
2. 有什么用
特征越好,模型的性能越好,而且可以不用很复杂的数学模型也能达到不错的效果