根据原有的属性我们可以创建出新的属性集,而且新的属性数目可能少于原有的属性数目,也就是降维。
创建新的属性的方法有三种:特征提取、映射数据到新的空间、特征构造
1、特征提取
定义:根据原有的数据自己创建新的属性集。
有的数据的属性是非常多的,而特征提取技术都是具体针对某个领域的而不是通用的,因此对数据的处理需要一些较高层次的抽象,提供一些较高层次的属性。比如照片的集合,按照照片是否包含人脸进行分类,而原始数据是像素的集合,因此许多分类算法都不适用,而如果抽象成与人脸高度相关的某些类型的边和区域,则可以对其应用更多的分类技术。
2、映射数据到新的空间
下图的时间序列是包含了3个时间序列的,
而3个时间序列中包含的其中2个时间序列如下图,他们频率分别是7HZ和17HZ,<