
NLP学习
逍遥客12138
这个作者很懒,什么都没留下…
展开
-
doc2vec论文方法解析及基于Gensim库的Python代码实现
文章目录一、全文概述二、word2vec三、doc2vec1. PV-DM2. PV-DBOW三、Python代码实现本文主要讲解Mikolov在2014年发表的论文《Distributed Representations of Sentences and Documents》,论文主要是基于word2vec方法的一种改进,建议在理解word2vec的基础再来看这篇文章。一、全文概述基于wo...原创 2019-11-26 20:36:18 · 1050 阅读 · 0 评论 -
WMD算法及python代码实现
本次讲解的论文来自J.Kusner等人2015年发表的论文,论文名字为From Word Embeddngs To Document Distances。一、全篇概述全篇最大的贡献是提出了WMD算法,并且为了提高计算速度,减低时间复杂度对模型进行了化简,得到WCD及RWMD算法,然后综合WCD及RWMD提出预取和修剪(Prefetch and prune),在几乎不影响算法准确率的情况下,大大...原创 2019-11-23 22:08:46 · 4347 阅读 · 3 评论 -
文本相似度综述
本文目录文本相似度的定义文本相似度计算方法基于字符串的方法基于语料库的方法基于词袋VSMLSA、PLSALDA(需要进一步了解)基于神经网络基于搜索引擎基于世界知识基于本体基于网络知识其他方法句法分析混合方法文本相似度的定义其中, common(A,B) 是 A 和 B 的共性信息,description(A,B) 是描述 A 和 B 的全部信息, 公式(1)表达出相似度与文本共性成正相关。...原创 2019-10-24 12:47:23 · 5033 阅读 · 4 评论 -
NLP初探(1)
1. AI工程师必备的核心技能转化现实生活中的问题数学优化问题通过合适的工具解决2. What is NLPNLP = NLG+ NLUNLG(Natural language Generation):意思 -> 文本/语音NLU(Natural language Understanding): 语音/文本 -> 意思3. NLP的经典应用场景Question An...原创 2019-09-13 22:16:43 · 298 阅读 · 0 评论 -
中文分词之最大匹配算法(前向、后向、双向及python实现)
文章目录1. 前向最大匹配算法1.1 前向最大匹配算法的原理2. 后向最大匹配算法2.1 后向最大匹配算法的原理3. 双向最大匹配算法3.1 双向最大匹配算法的原理1. 前向最大匹配算法1.1 前向最大匹配算法的原理首先,我们分词的目的是将一段中文分成若干个词语,前向最大匹配就是从前向后寻找在词典中存在的词。废话不多说,直接上例子:首先我们假设Max_len = 5,即假设单词的最大长度...原创 2019-09-19 09:33:28 · 16171 阅读 · 1 评论