38、语言模型:连续空间神经网络语言模型的应用与评估

语言模型:连续空间神经网络语言模型的应用与评估

1. 语言模型发展概述

在过去十年里,语言建模从标准的生成式马尔可夫模型风格的n - 元语法建模,转向了包含更多结构和不同概率估计技术的模型,如基于语法的语言模型、神经网络语言模型或判别式语言模型。这些模型在语音识别和机器翻译中都有应用。

神经网络语言模型(也称为连续空间语言模型)将文本处理中常用的离散词表示映射到连续表示,并在这个连续空间中估计n - 元语法概率。其动机在于连续表示可能会产生更平滑的概率估计,从而更好地泛化到未见的上下文。这种映射由一个具有特定架构的神经网络完成,该架构除了标准的隐藏层和输出层外,还包括一个映射(或投影)层。该层的权重在词汇表中的所有单词之间共享,并在语言模型训练期间与所有其他网络参数一起进行训练。

2. 连续空间神经网络语言模型的介绍

近年来,使用神经网络进行语言建模的兴趣日益浓厚。与依赖回退组件不同,神经网络方法试图通过在连续空间中进行估计来克服数据稀疏问题。早期,这种类型的语言模型主要用于领域内训练数据非常有限的任务。在EARS和GALE项目的背景下,开发了新的算法来在非常大的文本语料库上训练神经网络语言模型,这使得该方法能够应用于有数亿单词文本的领域。

连续空间语言模型的基本思想是将单词索引投影到连续空间,并使用在该空间上操作的概率估计器。由于得到的概率函数是单词表示的平滑函数,因此可以期望对未知n - 元语法有更好的泛化能力。神经网络可以同时学习单词到连续空间的投影并估计n - 元语法概率。这仍然是一种n - 元语法方法,但语言模型的后验概率是对任何长度为n - 1的可能上下文进行“插值”,而不是回退到更短的上下文。

到目前为

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值