NLP | 自然语言处理 - 语言模型（Language Modeling）

最新推荐文章于 2025-07-01 17:38:51 发布

原创

最新推荐文章于 2025-07-01 17:38:51 发布 · 3.6w 阅读

35 ·

CC 4.0 BY-SA版权

文章标签：

#自然语言处理 #nlp #text mining #machine learning #算法

本文介绍了自然语言处理中的语言模型，重点讲解了马尔可夫链，特别是二阶马尔可夫模型。通过定义字典、训练数据集和计算句子概率，阐述了语言模型的基本概念。并详细探讨了二阶马尔可夫模型的计算、度量方法——复杂度（Perplexity），以及如何处理数据稀疏性问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

为什么需要语言模型？

想象“语音识别”这样的场景，机器通过一定的算法将语音转换为文字，显然这个过程是及其容易出错的。例如，用户发音“Recognize Speech”，机器可能会正确地识别文字为“Recognize speech”，但是也可以不小心错误地识别为“Wrench a nice beach"。简单地从词法上进行分析，我们无法得到正确的识别，但是计算机也不懂语法，那么我们应该如果处理这个问题呢？一个简单易行的方法就是用统计学方法（马尔可夫链）从概率上来判断各个识别的正确可能性。