
NLP
shijiebei2009
Java、PHP、Scala、Android、Python、ML、NLP
展开
-
使用Stanford Word Segmenter and Stanford Named Entity Recognizer (NER)实现中文命名实体识别
一、分词介绍http://nlp.stanford.edu/software/segmenter.shtml斯坦福大学的分词器,该系统需要JDK 1.8+,从上面链接中下载stanford-segmenter-2014-10-26,解压之后,如下图所示,进入data目录,其中有两个gz压缩文件,分别是ctb.gz和pku.gz,其中CTB:宾州大学的中国树库训练资料 ,PKU:中国北京原创 2015-01-08 15:04:08 · 30032 阅读 · 10 评论 -
事件本体以及突发事件语料库--CEC(Chinese Emergency Corpus)
1、什么是本体?本体最初是一个哲学上的概念,十多年前被引入计算机领域中作为知识表示的方法并被广泛使用。Studer给出了本体的定义:“本体是共享概念模型的明确的形式化规范说明”。本体对于探索人的认知原理、发展自然语言理解技术和人机交互技术有重要意义。但是传统的本体模型存在着一系列的不足之处,1、作为知识的表示形式,在描述多远关系的能力上存在先天不足;2、认知科学家认为,人的概念大体可分为实体和事件,原创 2015-03-22 15:54:50 · 13393 阅读 · 4 评论