
NLP
Chen_Meng_
这个作者很懒,什么都没留下…
展开
-
NLP文本的表示,从【Bag-of-words】到 【word2vec】
1. Bag-of-words1.1 类似于one-hot的词袋模型 Bag of words模型最初被用在文本分类中,将文档表示成特征矢量。它的基本思想是假定对于一个文本,忽略其词序和语法、句法,仅仅将其看做是一些词汇的集合,而文本中的每个词汇都是独立的。简单说就是将每篇文档都看成一个袋子(因为里面装的都是词汇,所以称为词袋,Bag of words即因此而来),然后根...原创 2020-03-24 14:45:56 · 2110 阅读 · 0 评论 -
指针生成网络(Pointer-Generator Networks)的实现
指针生成网络的简介指针生成网络(Pointer-Generator Networks)是一个基于seq2seq+attention的生成模型,相比于seq2seq+attention的生成模型,它能够在一定的程度上解决oov(out of vocab)的问题。回顾seq2seq+attenion 这一篇博客有比较详述的解析对于seq2seq+attenti...原创 2020-03-10 20:26:38 · 11567 阅读 · 19 评论 -
Seq2Seq + attention 模型原理、训练,以及编码过程
目录1. 简介2. Seq2Seq2.1 Encoder2.2 Decoder3. Seq2Seq with Attention3.1 Decoder4. Train5. Decoding5.1 理论5.2 实例6 总结1. 简介Seq2Seq的基本结构是encoder-decoder,这个模型的目标是生成一个完整的句子。这个模型曾经使得谷...原创 2020-01-04 00:45:39 · 5878 阅读 · 3 评论