
理论层-自然语言处理
文章平均质量分 79
小丁丁_ddxdd
这个作者很懒,什么都没留下…
展开
-
Bag of Words(BOW)模型
来源:https://www.douban.com/note/310140053/BOW (bag of words) 模型简介Bag of words模型最初被用在文本分类中,将文档表示成特征矢量。它的基本思想是假定对于一个文本,忽略其词序和语法、句法,仅仅将其看做是一些词汇的集合,而文本中的每个词汇都是独立的。简单说就是讲每篇文档都看成一个袋子(因为里面装的都是词汇,所以称为词转载 2017-08-03 21:39:15 · 422 阅读 · 0 评论 -
向量空间模型(VSM)在文档相似度计算上的简单介绍
来源:http://blog.youkuaiyun.com/felomeng/article/details/4024078向量空间模型(VSM:Vector space model)是最常用的相似度计算模型,在自然语言处理中有着广泛的应用,这里简单介绍一下其在进行文档间相似度计算时的原理。假设共有十个词:w1,w2,......,w10,而共有三篇文章,d1,d2和d3。统计所得的词频表转载 2017-08-03 21:49:22 · 696 阅读 · 0 评论 -
自然语言处理---深度学习在情感分析中的应用
来源:https://mp.weixin.qq.com/s?__biz=MzAwNDI4ODcxNA==&mid=2652245443&idx=1&sn=b2de6db6962466d0f2bc8b2bd8283f3a&chksm=80cc9466b7bb1d709a0901c1661342277335dabee9cb269d3774083533279a49309890900a90&scene=0转载 2017-08-22 21:52:02 · 7354 阅读 · 0 评论 -
自然语言---哈夫曼树
来源:http://blog.youkuaiyun.com/shuangde800/article/details/7341289 一、哈夫曼树的概念和定义 什么是哈夫曼树?让我们先举一个例子。判定树: 在很多问题的处理过程中,需要进行大量的条件判断,这些判断结构的设计直接影响着程序的执行效率。例如,编制一个程序,将百分制转换成五个等级输出转载 2017-09-26 18:11:13 · 483 阅读 · 0 评论 -
文本数据的机器学习自动分类方法
来源:http://blog.youkuaiyun.com/jdbc/article/details/50586042本文为第一部分,着重介绍文本预处理以及特征抽取的方法。随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类、组织和管理,已经成为一个具有重要用途的研究课题。而在这些数据中,文本数据又是数量最大的一类。“文本分类是指在给定分类体系下,根据文本内容自动确转载 2017-10-08 21:45:00 · 25787 阅读 · 0 评论 -
自然语言--Trie树详解及其应用
链接:http://blog.youkuaiyun.com/hackbuteer1/article/details/7964147参考链接:https://segmentfault.com/a/1190000005810561一、知识简介 最近在看字符串算法了,其中字典树、AC自动机和后缀树的应用是最广泛的了,下面将会重点介绍下这几个算法的应用。 字典树(Tri转载 2017-10-13 11:33:54 · 412 阅读 · 0 评论 -
文本深度表示模型—word2vec&doc2vec词向量模型
来源:http://www.dataguru.cn/article-9478-1.html深度学习掀开了机器学习的新篇章,目前深度学习应用于图像和语音已经产生了突破性的研究进展。深度学习一直被人们推崇为一种类似于人脑结构的人工智能算法,那为什么深度学习在语义分析领域仍然没有实质性的进展呢?引用三年前一位网友的话来讲:“Steve Renals算了一下icas转载 2017-11-03 11:51:19 · 2211 阅读 · 0 评论