CS224n研究热点10 Character-Aware神经网络语言模型

Character-Aware神经网络语言模型
此模型旨在解决传统神经网络语言模型忽视结构相似词意义相近的问题,通过编码词素相关性来改善低频词的表示,并使用更少的参数获得可比的效果。模型采用卷积层读取字符嵌入,通过不同大小的卷积捕捉n-grams和子词,然后进行最大池化以获得特征向量。
04131219_pLG3.jpg本文由码农场同步,最新版本请查看原文:http://www.hankcs.com/nlp/cs224n-character-aware-neural-language-models.html
CS224n研究热点10 Character-Aware神经网络语言模型
动机大多数神经网络语言模型其实并没有注意到结构类似的词语意义也类似这种语言现象,这使它们无法赋予低频词合适的表示。所以这个新模型的目标是:编码词素相关性:eventful, eventfully, uneventful解决低频词问题用更少的参数得到comparable效果架构输入字符,但依然在词语级别做预测。卷积层读入字符的embedding,做不同大小的卷积(捕捉不同的ngram与subword),max池化后得到特征向量。Highway Network这种网络类似LSTM的Memory Cell,对输入...

继续阅读码农场 » CS224n研究热点10 Character-Aware神经网络语言模型

原文链接http://www.hankcs.com/nlp/cs224n-character-aware-neural-language-models.html


感谢阅读本文,欢迎 查看原文或访问 码农场 获取更多内容

转载于:https://my.oschina.net/hankcs/blog/1154054

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值