
机器学习-特征降维
村头陶员外
B站,小红书,抖音等平台搜索 “Forrest的数据科学站”
展开
-
机器学习-->特征降维方法总结
本篇博文主要总结一下机器学习里面特征降维的方法,以及各种方法之间的联系和区别。 机器学习中我个人认为有两种途径可以来对特征进行降维,一种是特征抽取,其代表性的方法是PCA,SVD降维等,另外一个途径就是特征选择。特征抽取先详细讲下PCA降维的原理对于n个特征的m个样本,将每个样本写成行向量,得到矩阵A寻找样本的主方向u:将m个样本值投影到某个直线L上,得到m个位于直线L上的点,计算m个投影点的方差原创 2017-07-25 16:11:16 · 16125 阅读 · 4 评论 -
机器学习-->特征选择
这篇博文将详细介绍sklearn中特征选择的相关内容,全文翻译自sklearn.Feature selection,并且加上了我自己的一些见解。 特征选择主要有三种办法: 其中第一种过滤型很少使用。sklearn.feature_selection模块中的类可用于样本集上的特征选择/维数降低,以提高学习器的准确度或提高其在高维数据集上的性能。去除低方差的特征 VarianceThreshold原创 2017-06-18 11:39:54 · 6719 阅读 · 0 评论