神经网络语言模型与词嵌入技术解析
1. 文本自动补全与语言模型基础
在自然语言处理的探索中,文本自动补全是一个重要的应用场景。此前,我们通过一个编程示例展示了基于长短期记忆网络(LSTM)的循环神经网络(RNN)如何用于文本自动补全。这也是自然语言处理领域网络应用的一个典型例子,区别于图像数据和数值数据处理。
在这个文本自动补全的例子里,我们选择对单个字符进行编码并输入网络。然而,更强大的方法是基于单个单词的粒度,并采用比独热编码更具表现力的编码方案。
1.1 统计语言模型概述
统计语言模型用于描述一个单词序列在其所建模的语言中出现的可能性。它通过为每个可能的单词序列分配一个概率来实现这一点。一个正确且常见的单词序列会被赋予较高的概率,而一个错误或不常见的单词序列则会被赋予较低的概率。
例如,当我们向语言模型输入一个单词序列时,它的输出是词汇表中每个单词作为该序列下一个单词的概率。统计语言模型通常基于条件概率来表述,即序列中下一个单词的概率取决于该序列中所有先前的单词。
1.2 语言模型的应用场景
语言模型除了用于文本自动补全外,在自然语言处理领域还有其他重要的应用:
- 语音识别 :在语音识别中,双向循环神经网络(RNN)可以同时考虑句子中的历史和未来单词。例如,当听到 “I saw the b… sky” 时,即使没有完全捕捉到所有单词,我们也可以合理预测缺失的单词是 “blue”。另外,对于 “recognize speech using common sense” 这样的短语,自动语音识别系统可能会输出类似发音的错误短语,如 “wreck
超级会员免费看
订阅专栏 解锁全文
1199

被折叠的 条评论
为什么被折叠?



