可以看到我们在分析数据的时候,我们希望减少需要分析的数据特征,但是同时,还要尽量的减少,特征包含信息的损失,那么,对于,相关性特别强的变量
我们就可以删除,这样来减少特殊的个数.
从而保留特征中的信息,而且降低要处理的数据数量,而且最后训练的模型也要准确度高才行
然后我们继续看,数据形式多种多样,维度也就是数据的特征也很多,那么怎么样进行数据降维,其中,我们之前都说是的,进行属性选择,也就是选择
重要的数据,去掉正相关的数据,去掉,相关性高的数据,这就是属性选择,然后
这里又提供一种,从高纬度特征空间向低纬度特征空间映射的思路,来降低数据维度
然后我们再来添加一列,反相关的数据,负相关的数据
这里
df['Chem&