特征的构建与选取在提高预测精度方面越来越受到重视,甚至影响到预测项目的成败。
通常初始特征是基于领域经验构建的,比如在预测短期负荷的时候,一般会考虑节假日、气温、历史负荷水平等因素来构建特征。然而这样得到的特征未必能够充分地描述目标变量,因此很有必要基于这些初始特征构建更多更强的特征,从而尽可能地提高预测精度。最近几年这方面的研究也不少,百度等科技巨头企业已经有成熟的特征学习算法,并且应用在相关的业务场景中。这里主要针对特征变换、特征组合、自动生成三方面进行详细介绍,并结合R语言代码进行实现,旨在能为实际的建模问题提供一些参考。