软子空间模式识别的通用框架
1. 引言
在统计模式识别中,隐马尔可夫模型(HMM)是对包含时间信息的模式(如语音和手写)进行建模的重要技术。若不考虑时间信息,则使用高斯混合模型(GMM),它利用高斯密度的混合来对从训练数据中提取的特征向量的分布进行建模。当训练数据较少时,矢量量化(VQ)技术也很有效。在基于模糊集理论的模式识别中,模糊聚类技术(如模糊c均值和模糊熵)用于为模糊HMM、模糊GMM和模糊VQ设计重新估计技术。
模式识别的第一阶段是数据特征选择,需提取最能表征待识别模式的特征,特征选择依赖于待识别模式,并直接影响识别结果。上述模式识别方法不能自动选择特征,因为它们平等对待所有特征。我们提出通过在建模过程中为特征分配权重来衡量其对模式识别的贡献,这种方法称为软子空间模式识别。虽然已有一些计算软子空间聚类权重的算法,但尚未构建上述建模方法的通用框架。
本文将提出软子空间模式识别的通用框架,为HMM设计通用目标函数,通过最大化该函数得到计算权重的算法,同时从HMM的算法中确定GMM和VQ的权重计算算法。所提出的软子空间模式识别方法将在网络入侵检测中进行评估,初步实验结果表明,这些算法可以提高识别率。
2. 连续隐马尔可夫模型
HMM的基本假设是语音信号可以很好地表征为参数随机过程,并且该随机过程的参数可以以精确、明确的方式进行估计。HMM方法为广泛的应用提供了可靠的语音识别方式。
一阶HMM有两个假设:
- 马尔可夫假设:在每个时间t,基于转移概率进入一个新状态,该转移概率仅取决于前一个状态,用于表征语音模式时间帧的序列。
- 输出独立性假设:输出概率仅取决于该时刻的状态,而与进入该状态的时间
超级会员免费看
订阅专栏 解锁全文
8613

被折叠的 条评论
为什么被折叠?



