软子空间模式识别的通用框架
1. 引言
在统计模式识别领域,针对包含时间信息的模式(如语音和手写)建模,隐马尔可夫模型(HMM)是最为重要的技术。若不考虑时间信息,则会采用高斯混合模型(GMM)。GMM 运用高斯密度的混合来对从训练数据中提取的特征向量分布进行建模。当训练数据较少时,向量量化(VQ)技术也十分有效。在基于模糊集理论的模式识别中,像模糊 c - 均值和模糊熵这样的模糊聚类技术,被用于为模糊 HMM、模糊 GMM 和模糊 VQ 设计重新估计技术。
模式识别的首要阶段是数据特征选择,需提取最能表征待识别模式的多个特征,且特征的选择依赖于待识别的模式,会直接影响识别结果。上述模式识别方法无法自动选择特征,因为它们对所有特征一视同仁。为此,提出通过在建模过程中为特征分配权重来衡量其对模式识别的贡献,这种方法被称为软子空间模式识别。虽已有一些计算软子空间聚类权重的算法,但尚未构建出上述建模方法的通用框架。
本文将提出软子空间模式识别的通用框架,为 HMM 设计通用目标函数,通过最大化该函数得出计算权重的算法,同时从 HMM 的算法推导出 GMM 和 VQ 的权重计算算法。所提出的软子空间模式识别方法将在网络入侵检测中进行评估,初步实验结果表明这些算法能提高识别率。
2. 连续隐马尔可夫模型
HMM 的基本假设是语音信号可被很好地描述为参数化随机过程,且该随机过程的参数能以精确、明确的方式进行估计。HMM 方法为广泛应用中的语音识别提供了可靠途径。
一阶 HMM 有两个假设:
- 马尔可夫假设:在每个时间 t 基于转移概率进入新状态,该转移概率仅依赖于前一个状态,用于表征语音模式时间帧的序列。
超级会员免费看
订阅专栏 解锁全文
8597

被折叠的 条评论
为什么被折叠?



