
统计聚类
porly
11111
展开
-
观测数据的相关系数计算方法
1、变量xi与xj的夹角余弦定义为 它是Rn中变量xi的观测向量(x1i,x2i,⋯,xni)′与变量xj的观测向量(x1j,x2j,⋯,xnj)′之间夹角θij的余弦函数,即cij(1)=cosθij。 2.变量xi与xj的相关系数为 如果变量xi与xj是已标准化了的,则它们间的夹角余弦就是相关系数。原创 2012-09-07 12:01:11 · 2443 阅读 · 0 评论 -
贝叶斯原理简介
贝叶斯决策理论是主观贝叶斯派归纳理论的重要组成部分。 贝叶斯决策就是在不完全情报下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策。 贝叶斯决策理论方法是统计模型决策中的一个基本方法,其基本思想是: 1、已知类条件概率密度参数表达式和先验概率。 2、原创 2012-09-07 18:31:51 · 2945 阅读 · 0 评论 -
贝叶斯理论
1.贝叶斯法则 机器学习的任务:在给定训练数据D时,确定假设空间H中的最佳假设。 最佳假设:一种方法是把它定义为在给定数据D以及H中不同假设的先验概率的有关知识下的最可能假设。贝叶斯理论提供了一种计算假设概率的方法,基于假设的先验概率、给定假设下观察到不同数据的概率以及观察到的数据本身。 2.先验概率和后验概率 用P(h)表示在没有训练数据前转载 2012-09-07 18:36:05 · 2409 阅读 · 0 评论 -
线性判别分析(LDA), 主成分分析(PCA)
版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com 前言: 第二篇的文章中谈到,和部门老大一宁出去outing的时候,他给了我相当多的机器学习的建议,里面涉及到很多的算法的意义、学习方法等等。一宁上次给我提到,转载 2012-09-07 18:58:34 · 1132 阅读 · 0 评论 -
线性判别分析LDA解析2
首先搞清楚什么叫判别分析?Discriminant Analysis就是根据研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。 根据判别标准不同,可以分为距离判别、Fisher判别、Bayes判别法等。比如在KNN中用的就是距离判别,当然这里的“距离”又有好几种:欧氏距离、街区距离、甚至可以用皮尔森相关系数等。朴素贝叶斯分类用的就是Bayes判别法。本文要讲的线性判别分析就是用是F转载 2012-09-26 15:00:23 · 3974 阅读 · 0 评论