14、统计的力量：从骰子游戏到语音识别

统计模型在语音识别中的应用

最新推荐文章于 2025-11-24 20:15:00 发布

blue

最新推荐文章于 2025-11-24 20:15:00 发布

阅读量29

点赞数

CC 4.0 BY-SA版权

分类专栏：机器如何理解人类语音文章标签：统计语言模型隐藏马尔可夫模型语音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/blue/article/details/152114990

机器如何理解人类语音专栏收录该内容

37 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

统计的力量：从骰子游戏到语音识别

1. 问题引入：概率与决策

在一些情境中，我们需要找到基于观察结果的最高概率情况。以不公平骰子游戏为例，我们观察到骰子的滚动结果，要找出可能的选盒序列和骰子序列；在语音识别中，我们观察到特征向量，需要找出对应的单词序列。

解决骰子游戏问题，需要知道游戏的所有概率，包括选盒、选骰子以及每个骰子的滚动结果概率。对于给定的骰子滚动观察结果，计算所有可能的选盒序列和骰子序列的条件概率，这会涉及大量计算，此时可以考虑使用动态规划。

2. 统计语言模型

在语言和语音识别领域，我们将问题用概率重新表述。单词序列就像被选中的隐藏盒子序列，是语音识别器需要找到的未知信息。识别器“观察”到与待识别语音帧对应的特征向量序列，要基于这些观察恢复原始的单词序列。

一个好的策略是在所有可能的单词序列中，找到在观察到特征向量的条件下具有最高条件概率的序列。但并非所有单词序列的概率都相同，例如“Lions are ferocious animals”比“Lions highway one telephone down”更常见。

语音识别科学家使用统计语言模型对给定词汇集内的所有允许句子按概率进行排序。传统语言学家严格区分符合语法规则和不符合的句子，而语言统计学家通常不做这种严格区分，认为所有句子在语言中都是允许的，只是有些更常见。统计语言模型是一种计算工具，能给出任何给定单词序列在特定语言中出现的概率。

语言中单词序列的概率受多种因素影响，其中一个重要因素是上下文，即语言领域。例如，在动物学课程中，涉及狮子、老虎等动物的句子概率更高；在房地产销售场景中，涉及房屋购买、抵押等的句子概率更高。 </

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。