
机器学习
**gh**
这个作者很懒,什么都没留下…
展开
-
PCA(主成分分析)的学习笔记
1、基于特征值分解协方差矩阵实现PCA算法输入:数据集,需要降到k维。1) 去平均值(即去中心化),即每一位特征减去各自的平均值。、2) 计算协方差矩阵3) 用特征值分解方法求协方差矩阵的特征值与特征向量。4) 对特征值从大到小排序,选择其中最大的k个。然后将其对应的k个特征向量分别作为行向量组成特征向量矩阵P。5) 将数据转换到k个特征向量构建的新空间中,即Y=PX。2、基于SVD分解协方差矩阵实现PCA算法输入:数据集,需要降到k维。1) 去平均值,即每一位...原创 2020-11-20 09:56:55 · 531 阅读 · 0 评论 -
pycharm报DeprecationWarning错 、Numpy clip函数
1、当pycharm运行报DeprecationWarning: threshold_ attribute is deprecated in 0.20 and will be removedin0.22.错误时:可添加以下代码解决import warningswarnings.filterwarnings("ignore")2、Numpy clip函数numpy.clip(a, a_min, a_max, out=None)[source]其中a是一个数组,a_min, ...原创 2020-11-09 11:51:34 · 1064 阅读 · 0 评论 -
numpy.random.RandomState 和 Numpy.random.seed() 的用法
1. numpy.random.RandomState()这是一个伪随机数生成器。生成[0,1]均匀分布的随机数序列,但并不真正的随机,但具有类似于随机数的统计特征,如均匀性、独立性等。rng = np.random.RandomState(0)因为是伪随机数,所以必须在rng这个变量下使用,如果不这样做,那么就得不到相同的随机数组了例如:只在最开始用了rng=np.random.RandomState(0),得到了不同的随机数组再如:不在rng变量下使用,及时用np..原创 2020-11-09 10:53:52 · 781 阅读 · 0 评论 -
python 分析数据及预处理用到的函数
train =pd.read_csv("../input/train.csv")test =pd.read_csv("../input/test.csv")train.describe(include="all")//#查看数值型数据情况:train.describe() #查看字符型数据情况:train.describe(include=['0']) pd.set_option('display.max_columns', None)#显示所有列,解决输出的...原创 2020-11-09 10:04:49 · 816 阅读 · 0 评论