本文由码农场同步,最新版本请查看原文:http://www.hankcs.com/nlp/cs224n-character-aware-neural-language-models.html

动机大多数神经网络语言模型其实并没有注意到结构类似的词语意义也类似这种语言现象,这使它们无法赋予低频词合适的表示。所以这个新模型的目标是:编码词素相关性:eventful, eventfully, uneventful解决低频词问题用更少的参数得到comparable效果架构输入字符,但依然在词语级别做预测。卷积层读入字符的embedding,做不同大小的卷积(捕捉不同的ngram与subword),max池化后得到特征向量。Highway Network这种网络类似LSTM的Memory Cell,对输入...
继续阅读:码农场 » CS224n研究热点10 Character-Aware神经网络语言模型
原文链接:http://www.hankcs.com/nlp/cs224n-character-aware-neural-language-models.html