
中文分词
文章平均质量分 66
凌风探梅
这个作者很懒,什么都没留下…
展开
-
中文分词器分词效果的评测方法
[原创]中文分词器分词效果的评测方法2013年8月27日 由 learnhard留言 »转载请注明出处:http://www.codelast.com/现在有很多开源的中文分词器库,如果你的项目要选择其一来实现中文分词功能,必然要先评测它们的分词效果。如何评测?下面详细叙述。【1】黄金标准/Golden standard所谓的黄金标准是指:评价一个分词器转载 2015-11-25 13:52:17 · 3886 阅读 · 0 评论 -
Weka使用笔记
from:http://blog.sina.com.cn/s/blog_4766fd440101iyb0.html前些日子基于weka初步做了一下文本分类,使用的是最频繁使用的矢量空间模型(Vector Space Model),即假设正负样本在特征空间的分布迥异,基于某种规则将它们转化为矢量,然后训练分类器来区分这些矢量,测试样本来时送进分类器进行分类就行。在我的实验里面转载 2015-11-25 14:06:38 · 1943 阅读 · 0 评论 -
中文分词测试集
The Second International Chinese Word Segmentation Bakeoff took place over the summer of 2005 and the results were presented at the 4th SIGHAN Workshop, held at IJCNLP'05, October 14-15.Corpora fr转载 2015-11-25 13:57:54 · 2672 阅读 · 0 评论 -
分词URL
原北邮人论坛上的两个停用词表分类: 中文分词、全文检索统计: 0评/211阅/1赞262014-11转Async Solr Queries in Python分类: 中文分词、全文检索统计: 0评/19阅/0赞022014-10转转载:谈谈BM25评分分类: 中文分词、全文检索统计: 1评/转载 2016-04-28 10:21:09 · 1075 阅读 · 0 评论 -
ICTCLAS 汉语词性标注集
ICTCLAS 汉语词性标注集发表于1年前(2014-12-05 11:34) 阅读(571) | 评论(0) 2人收藏此文章, 我要收藏赞0ICTCLAS 汉语词性标注集 汉语文本词性标注标记集 Ag 形语素 形容词性语素。形容词代码为a,语素代码g前面置以A。 a 形容词 取英语形容词adjective的第1个字母。 ad 副转载 2016-04-25 09:36:03 · 1375 阅读 · 0 评论 -
深度学习将会变革NLP中的中文分词
深度学习将会变革NLP中的中文分词2016-08-08 19:03 转载 陈圳 0条评论 雷锋网按:本文转自ResysChina高翔,文章主要介绍了1)区分中文分词的方法;2)用深度学习的方法来解决中文分词的好处及其具体应用。现有分词介绍自然语言处理(NLP,Natural Language Processing)是一个信息时代最重要转载 2016-08-22 09:29:40 · 1912 阅读 · 0 评论