
Doc2vec
文章平均质量分 85
mpk_no1
这个作者很懒,什么都没留下…
展开
-
深度学习笔记——Word2vec和Doc2vec应用举例:词和句子的相似度计算
本文主要介绍一个Word2vec和Doc2vec应用示例:用Word2vec和Doc2vec做句子相似度计算。原创 2017-05-18 21:45:54 · 23300 阅读 · 3 评论 -
层次聚类实例以及Java实现
本文主要讲述一个层次聚类实例,使用层次聚类算法将相似图书的目录进行聚类。由于不知道要聚为多少类,所以Kmeans聚类算法不适用,而层次聚类由于不需要设置聚类中心数,只要传递一个阈值即可,所以正好适合于这个问题。本文将结合层次聚算法的原理以及其Java代码实现来展现文本聚类的一个实现方式。具体代码见我的GitHub(点击打开链接)原创 2017-05-22 12:16:11 · 6860 阅读 · 2 评论 -
深度学习笔记——Word2vec和Doc2vec训练实例以及参数解读
本篇主要用一个实例来介绍一下如何进行Word2vec和Doc2vec的训练,并对Word2vec和Doc2vec模型训练过程中的参数进行一些解读。使用的是Python版本的gensim库实现,想要了解Word2vec和Doc2vec的原理可以查看我的上一篇博客( 深度学习笔记——Word2vec和Doc2vec原理理解并结合代码分析)。代码见我的GitHub(使用Gensim库训练Word2vec和Doc2vec模型)原创 2017-05-18 21:43:37 · 19077 阅读 · 1 评论 -
深度学习笔记——Word2vec和Doc2vec原理理解并结合代码分析
一直在用Word2vec和Doc2vec做Embedding,但是刚开始用的时候对其原理一直是一知半解,只是知道怎么用而已。古人云:既要知其然,也要知其所以然。所以,结合作者论文,以及网上各位前辈的博客和开源代码之后,抽空写写自己对Word2vec和Doc2vec原理的理解,以及结合代码做一些分析。希望能够有用,有错误也请各位朋友批评指正!原创 2017-05-18 10:16:54 · 48217 阅读 · 6 评论 -
深度学习笔记——情感分析
本文使用三种深度学习方法对IMDB评论进行情感分析。这三种方法为:MLP、BiRNN(LSTM、GRU)、BiGRU+Attention。原创 2017-05-11 22:14:06 · 35360 阅读 · 23 评论 -
深度学习笔记——基于Word2vec和Doc2vec的句子对匹配方法
句子对匹配(Sentence Pair Matching)问题是NLP中非常常见的一类问题,所谓“句子对匹配”,就是说给定两个句子S1和S2,任务目标是判断这两个句子是否具备某种类型的关系。本文是一个Word2vec和Doc2vec的应用,使用Word2vec和Doc2vec得到句子的向量表示,然后计算cosin相似度,本文在Quora公开的一个数据集上做了一些对比试验,是一种无监督的句子对匹配方法。原创 2017-06-01 22:39:24 · 12536 阅读 · 4 评论 -
深度学习笔记——基于传统机器学习算法(LR、SVM、GBDT、RandomForest)的句子对匹配方法
句子对匹配(Sentence Pair Matching)问题是NLP中非常常见的一类问题,所谓“句子对匹配”,就是说给定两个句子S1和S2,任务目标是判断这两个句子是否具备某种类型的关系。本文用机器学习算法实现了一种有监督的句子对匹配方法,使用的机器学习分类算法有:逻辑回归(LR)、SVM、GBDT和随机森林(RandomForest),使用的工具是Sklearn。并在Quora公开的一个数据集上做了一些对比试验。原创 2017-06-01 22:41:38 · 8668 阅读 · 0 评论