第一步:若到手数据为非数值型数据,则对齐进行数值映射,变换为数值型数据,目前常见的映射方法有One-hot编码。
第二步:对数据进行维数判断,若数据维数过高,不便处理和显示,则对其进行降维处理(目前常见的降维方法有PCA,RPCA等),若数据维数过低,特征不明显,则对其进行升维处理(目前常见的数据升维方法有支持向量机等)。
第三步:数据归一化:
第四步:数据标准化:
将数据变换到均值为0,方差为1的范围内。
第一步:若到手数据为非数值型数据,则对齐进行数值映射,变换为数值型数据,目前常见的映射方法有One-hot编码。
第二步:对数据进行维数判断,若数据维数过高,不便处理和显示,则对其进行降维处理(目前常见的降维方法有PCA,RPCA等),若数据维数过低,特征不明显,则对其进行升维处理(目前常见的数据升维方法有支持向量机等)。
第三步:数据归一化:
第四步:数据标准化:
将数据变换到均值为0,方差为1的范围内。