
NLP方面资源集
jyNext
这个作者很懒,什么都没留下…
展开
-
nlpers上面关于自然语言处理(NLP)如何入门的文章
Getting Started in NLP Since starting the blog, a few people have asked me how one can get started in NLP, while residing in a department lacking NLP researchers. This is a difficult question:转载 2013-01-01 16:00:24 · 1601 阅读 · 0 评论 -
中文分词的资源收集
paper: @张开旭XMU收集的从92年到2012年的paper系列 web: 中文分词开源软件ICTCLAS, 关于ICTCLAS学习的网站原创 2013-01-05 20:33:19 · 2186 阅读 · 0 评论 -
常见中文分词开源项目
SCWS Hightman开发的一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的切分成词。采用的是采集的词频词典,并辅以一定的专有名称,人名,地名,数字年代等规则识别来达到基本分词,经小范围测试大概准确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、关键字提取等场合运用。45Kb左右的文本切词时间是0.026秒,大概是1.5MB文本/秒,支持PHP4和 PH转载 2013-01-05 20:58:37 · 1047 阅读 · 1 评论