
论文阅读
文章平均质量分 76
dreamsnowZ
这个作者很懒,什么都没留下…
展开
-
阅读论文《MOJITALK: Generating Emotional Responses at Scale》——ACL2018
假设: 一句话中携带的emoji表情就能表达这句话的含义。 根据twitter上的emoji表情,建立一个大规模的有标签的情感数据集 现有的情感数据集的问题: 量小 / 粗粒度(pos,neg) 评测:automatically evaluated by a separate sentence-to-emoji classifer + human evaluation (A...原创 2018-09-24 20:33:49 · 1024 阅读 · 0 评论 -
OOV问题-论文笔记《Neural Machine Translation of Rare Words with Subwords Units》- ACL2016
原论文链接: https://arxiv.org/abs/1508.07909参考paperweekly关于分词的一个总结:https://zhuanlan.zhihu.com/p/22700538这篇文章主要解决的问题是OOV(Out of Vocabulary)问题,最小粒度介于word和character之间,利用BPE算法进行分词。BPE算法的主要实现如图:import re, c...原创 2018-10-18 21:25:50 · 8935 阅读 · 0 评论 -
论文笔记《Shakespearizing Modern Language Using Copy-Enriched Sequence-to-Sequence Models》—ACL2017
这篇论文运用parallel data,进行文本风格迁移(从莎士比亚风转为现代风)。整体模型思路比较简洁明了:attention-based seq2seq + pointer network数据集大小为:training: 18395 val: 1218 test: 1462值得注意的是,由于数据集比较小,作者采用了很多减少参数的方法来训练模型:采用pre-trained ...原创 2018-12-23 22:05:19 · 625 阅读 · 0 评论