1.概念
特征工程是把原始数据转变为模型的训练数据的过程,目的是获取更好的训练数据特征。通常分为特征构建、特征提取、特征选择三个部分。
- 特征提取:通过特征转换的方式得到一组具有明显物理或统计意义的特征
- 特征选择:从特征集合中挑选一组具有明显物理或统计意义的特征子集。两者都能帮助减少特征的维度、数据冗余,特征提取有时能发现更有意义的特征属性,特征选择的过程经常能表示出每个特征的重要性对于模型构建的重要性
- 特征构建:从原始数据中人工的找出一些具有物理意义的特征。属性分割和结合是特征构建时常使用的方法。
2.特征提取
- PCA主成分分析 https://blog.youkuaiyun.com/zhongkejingwang/article/details/422644792.2
- LDA线性判别分析 http://www.cnblogs.com/pinard/p/6244265.html