
模式识别
文章平均质量分 75
发布各种模式识别学习中的心得体会。
兼顾统计模式识别、结构模式识别。
ycheng_sjtu
上海交通大学自动化系,关注模式识别,机器学习,算法研究,人工智能, 移动互联网等学科和产业,希望结识更多同道中人。
展开
-
隐马尔科夫模型(HMM)及其实现
马尔科夫模型马尔科夫模型是单重随机过程,是一个2元组:(S,A)。其中S是状态集合,A是状态转移矩阵。只用状态转移来描述随机过程。 马尔科夫模型的2个假设有限历史性假设:t+l时刻系统状态的概率分布只与t时刻的状态有关,与t时刻以前的状态无关;齐次性假设:从t时刻到t+l时刻的状态转移与t的值无关。 以天气模型为例天气变化有3中状态S:{1(阴),2(云),原创 2014-08-27 10:01:16 · 7006 阅读 · 6 评论 -
贝叶斯决策理论(一)
\[P\left( {{\omega _i}\left| X \right.} \right)\]原创 2014-04-16 22:34:43 · 3209 阅读 · 0 评论 -
贝叶斯决策理论(二)
基于最小风险的贝叶斯决策原创 2014-04-25 23:20:50 · 2760 阅读 · 0 评论 -
贝叶斯决策理论(三)
本节结合上2节内容介绍正态分布的贝叶斯分类器。首先介绍多元正态分布的数学基础。密度函数原创 2014-04-26 17:18:32 · 3204 阅读 · 0 评论 -
特征选择(一)-维数问题与类内距离
什么是特征选择?简单说,特征选择就是降维。 特征选择的任务就是要从n维向量中选取m个特征,把原向量降维成为一个m维向量。但是降维必须保证类别的可分离性或者说分类器的性能下降不多。 注意降维具有片面性,算法并不普适。常常会有失效发生。 降维这件小事在图像处理中叫做图像压缩、特征提取。重在最优区分(可分离性)。在模式识别中叫做特征选择。重在最优描述(保真性)。原创 2014-05-08 23:26:45 · 16070 阅读 · 3 评论 -
特征选择(二)-聚类变换
上一讲已经给出了类内距离的概念。针对这个概念,有人从完全不同的两个角度给出了方法。这就是聚类变换与K-L变换。本章介绍聚类变换。 降维到底是在干什么?各个特征(各个分量)对分类来说,其重要性当然是不同的。舍去不重要的分量,这就是降维。 关键问题是,什么叫不重要?这就是为什么会有两种不同的变换了。 聚类变换认为:重要的分量就是能让变换后类内距离小的分量。原创 2014-05-10 22:06:19 · 5175 阅读 · 0 评论 -
特征选择(三)-K-L变换
上一讲说到,各个特征(各个分量)对分类来说,其重要性当然是不同的。舍去不重要的分量,这就是降维。 聚类变换认为:重要的分量就是能让变换后类内距离小的分量。类内距离小,意味着抱团抱得紧。 但是,抱团抱得紧,真的就一定容易分类么?如图1所示,根据聚类变换的原则,我们要留下方差小的分量,把方差大(波动大)的分量丢掉,所以两个椭圆都要向y轴投影,这样悲剧了,两个重叠在一起,根本原创 2014-05-11 07:37:00 · 17617 阅读 · 3 评论 -
特征选择(四)-分散度
度量类别可分离性的量主要有:欧氏距离(正态分布,协方差相等,且为单位阵)是最简单的一种描述方法。它把两个类别中心之间的欧式距离作为两个不同类别间不相似性的度量。马氏(Mahalanobis)距离(正态分布,协方差相等)它用来描述两个具有相同的协方差矩阵C,不同的期望值和的类别之间的不相似性,具体表达式是:Mahalanobis距离原创 2014-05-11 23:59:06 · 8502 阅读 · 0 评论 -
句法模式识别(一)-串文法
前面介绍的所有思想都属于统计模式识别,然而统计模式识别存在2个问题:1.有的模式结构很复杂,不能用一个矢量来表示。2.有的模式识别任务中,我们更关心如何描述它的结构特征。 因此需要另外一种模式识别:结构模式识别。这其中,句法模式识别主要使用形式语言来描述模式结构,在理论上完备,表1是句法模式识别与统计模式识别的对应关系,下面做介绍。 表1串文法就是一种机器能原创 2014-05-16 10:53:09 · 5379 阅读 · 1 评论 -
句法模式识别(二)-正规文法、上下文无关文法
正规文法的特性1.所有长度有限的语言都是正规的。2.用正规文法当然能产生无限长串,其中周期重复部分的长度不大于非终止符的长度。举个例子在此规则之下,能生成句子其中周期重复部分为ab,这个例子的非终止符的元素个数为2,故满足2不大于2. 自嵌入特性我们把上下文无关文法中的正规文法去掉,剩下的那部分我们叫做真正的上下文无关文法。自嵌入特性是区分真正的上下文无原创 2014-05-17 23:52:35 · 10199 阅读 · 1 评论