统计的力量:从骰子游戏到语音识别
1. 问题引入:概率与决策
在一些情境中,我们需要找到基于观察结果的最高概率情况。以不公平骰子游戏为例,我们观察到骰子的滚动结果,要找出可能的选盒序列和骰子序列;在语音识别中,我们观察到特征向量,需要找出对应的单词序列。
解决骰子游戏问题,需要知道游戏的所有概率,包括选盒、选骰子以及每个骰子的滚动结果概率。对于给定的骰子滚动观察结果,计算所有可能的选盒序列和骰子序列的条件概率,这会涉及大量计算,此时可以考虑使用动态规划。
2. 统计语言模型
在语言和语音识别领域,我们将问题用概率重新表述。单词序列就像被选中的隐藏盒子序列,是语音识别器需要找到的未知信息。识别器“观察”到与待识别语音帧对应的特征向量序列,要基于这些观察恢复原始的单词序列。
一个好的策略是在所有可能的单词序列中,找到在观察到特征向量的条件下具有最高条件概率的序列。但并非所有单词序列的概率都相同,例如“Lions are ferocious animals”比“Lions highway one telephone down”更常见。
语音识别科学家使用统计语言模型对给定词汇集内的所有允许句子按概率进行排序。传统语言学家严格区分符合语法规则和不符合的句子,而语言统计学家通常不做这种严格区分,认为所有句子在语言中都是允许的,只是有些更常见。统计语言模型是一种计算工具,能给出任何给定单词序列在特定语言中出现的概率。
语言中单词序列的概率受多种因素影响,其中一个重要因素是上下文,即语言领域。例如,在动物学课程中,涉及狮子、老虎等动物的句子概率更高;在房地产销售场景中,涉及房屋购买、抵押等的句子概率更高。 </
统计模型在语音识别中的应用
超级会员免费看
订阅专栏 解锁全文
3235

被折叠的 条评论
为什么被折叠?



