
NLP
文章平均质量分 65
Sissi_cici
这个作者很懒,什么都没留下…
展开
-
WordNet介绍和使用
zhuWordnet是一个词典。每个词语(word)可能有多个不同的语义,对应不同的sense。而每个不同的语义(sense)又可能对应多个词,如topic和subject在某些情况下是同义的,一个sense中的多个消除了多义性的词语叫做lemma。例如,“publish”是一个word,它可能有多个sense:1. (39) print, publish -- (put into pri转载 2014-04-15 17:11:17 · 1976 阅读 · 0 评论 -
Windows平台下安装NLTK
在网上找了一圈,没找到几个靠谱的安装流程,在http://nltk.org/install.html上找到各平台下安装流程:Windows平台:以下操作假定你的机器上还没有安装Python,如果你已经安装Python,请跳过最后一步,只需要安装NLTK。32位二进制版安装:1.安装Python:http://www.python.org/getit/,选择2.7.3转载 2014-04-15 17:12:37 · 1152 阅读 · 0 评论 -
WordNet Interface(Wordnet一些有用的函数,做了一下标注方便查找)
WordNet InterfaceWordNet is accessed just another NLTK corpus reader, and can be imported like this:>>> from nltk.corpus import wordnetFor more compact code, we recommend:>>> from nltk.转载 2014-04-17 15:20:20 · 4256 阅读 · 0 评论 -
N-gram模型的优缺点
不知不觉发现最近学了好多查询扩展方面的东东,对原创 2014-04-10 16:37:19 · 9777 阅读 · 0 评论 -
中文词性标注解释一览表
Definitions of Chinese Part-of-Speech中文词性标注(33) [1] AD 副词 Adverbs[2] AS 语态词 --- 了[3] BA 把[4] CC 并列连接词(coordinating conj)[5] CD 许多(many)转载 2014-11-01 11:54:19 · 2376 阅读 · 0 评论 -
自然语言处理(NLP)常用开源工具总结----不定期更新
学习自然语言这一段时间以来接触和听说了好多开源的自然语言处理工具,在这里做一下汇总方便自己以后学习,其中有自己使用过的也有了解不是很多的,对于不甚了解的工具以后学习熟悉了会做更新的。1.IKAnalyzerIK Analyzer是一个开源的,基于Java语言开发的轻量级的中文分词工具包。从2006.12推出1.0版本开始,IK Analyzer已经推出了多个版本,当转载 2014-11-01 11:14:46 · 2128 阅读 · 0 评论