之前笔记(总结)-统计语言模型主要介绍了统计语言模型。可以看到,最终对句子的建模为(以二元文法为例):
核心问题在于如何计算参数 p(wi|wi−1) p ( w i | w i − 1 ) 。根据计算参数的不同方法,语言模型分为:
- 统计语言模型:极大似然估计
- 神经语言模型:神经网络预测
神经语言模型
可以看到,模型的输入即为 wi−1 w i − 1 的one-hot表示。输出为一个 |
本文介绍了神经语言模型,从one-hot表示到词的分布式表示,详细讲解了Bengio的NNLM和Mikolov的CBOW、Skip-gram模型。这些模型旨在通过词向量捕获词之间的语义关系,简化语言模型并提高自然语言处理任务的效率。
之前笔记(总结)-统计语言模型主要介绍了统计语言模型。可以看到,最终对句子的建模为(以二元文法为例):
核心问题在于如何计算参数 p(wi|wi−1) p ( w i | w i − 1 ) 。根据计算参数的不同方法,语言模型分为:
可以看到,模型的输入即为 wi−1 w i − 1 的one-hot表示。输出为一个 |
326

被折叠的 条评论
为什么被折叠?