
统计学习
秋男不吃牛肉豆制品牛奶小麦
这个作者很懒,什么都没留下…
展开
-
《统计学习方法》——奇异值分解(SVD)
奇异值分解(singular value decomposition,SVD)是矩阵因子分解方法。主成分分析、潜在语义分析都用到奇异值分解。矩阵的奇异值分解可以看作是方阵对角化的推广。15.1 奇异值分解的定义与性质15.1.1 定义与定理定义15.1(奇异值分解)矩阵的奇异值分解是指,将一个非零的m×nm\times nm×n实矩阵AAA,A∈Rm×nA\in R^{m\times...原创 2020-07-14 10:37:50 · 686 阅读 · 0 评论 -
8.4 提升树
提升树1 . 提升树模型 提升方法实际是采用加法模型与前向分布算法 ,以 决策树为基函数 的提升方法称为提升树(boosting tree)。对分类问题决策树是二叉分类树,对回归问题决策树是二叉回归树。提升树模型可以表示为决策树的加法模型:fm(x)=fm−1(x)+T(x;Θm) f_m(x)=f_{m-1}(x)+T(x;\Theta_m)fm(x)=fm−1(x)+T(x;Θm...原创 2019-05-09 21:37:58 · 216 阅读 · 0 评论 -
kaggle新手第三场比赛——Instant-Gratification-top3%(1)
1.项目介绍 这场比赛中给出了二分类的数据集和一首藏头诗,这首诗中暗藏的玄机我们会在接下来的分析当中逐渐给出说明。比赛的数据集依旧是老三样:训练集(train.csv)、测试集合(test.csv)以及结果提交模版(submission.csv)。Silly column names abound, but the test set is a mystery. Careful how y...原创 2019-06-23 18:07:32 · 956 阅读 · 0 评论 -
李航《统计学习方法》——马尔可夫链蒙特卡罗法
蒙特卡罗法(也称为统计模拟方法)是通过从概率模型的随机抽样进行近似数据计算的方法。马尔可夫链蒙特卡罗(MCMC)法是以马尔可夫链为概率模型的蒙特卡罗法。 MCMC方法的基本思想是:通过蒙特卡罗法构建一个马尔可夫链,使其平稳分布就是要进行抽样的分布,首先基于该马尔可夫链进行随机游走,产生样本序列,之后使用该平稳分布的样本进行近似的数值计算。19.1 蒙特卡罗法19.1.1 随机抽样 ...原创 2019-06-28 16:45:33 · 1857 阅读 · 0 评论 -
李航《统计学习方法》——聚类方法
聚类方法有很多,下面叙述最常用的两种聚类方法:层次聚类和k均值聚类。层次聚类又有聚合和分裂两种方法。聚合法开始将每个样本各自分到一个类;之后将距离最近的两类合并,建立一个新的类;之后将已有类别中相聚最远的样本分到两个新的类,重复此操作直到满足停止条件,得到层次化的类别。14.1 聚类的基本概念14.1.1 相似度或距离 聚类的对象是观测数据或样本集合。...原创 2019-06-28 16:46:11 · 919 阅读 · 0 评论 -
EM算法、GMM、K-means
EM算法是一种迭代算法,用于含有隐含变量的概率模型参数的极大似然估计,或者极大后验概率估计。EM算法的每次迭代由两步组成:E步,求expection;M步,求maximization. 此算法也成为期望极大算法(expection maximization),EM算法。9.1 EM 算法的引入9.1.1 EM 算法 将可观测数据表示为Y=(Y1,Y2,⋅⋅⋅,Yn)TY=(Y_1,...原创 2019-06-28 16:46:43 · 466 阅读 · 0 评论