
nutch
文章平均质量分 83
Dennydev
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
nutch1.1导入eclipse中运行
Nutch导入eclipse 最近在开始研究nutch刚把它在eclipse中跑起来,方便研究源码吧。本文针对的是nutch1.1版本。如有不对的地方欢迎指证。 直接导入eclipse. 1.首先下载nutch的最新版本, http://apache.etoak.com/nutch/ 本文写作时nutch的最新版本为1.1。所以本文以下所述均针对nutch1.1。(注意笔者在下载时...原创 2010-09-06 16:11:47 · 354 阅读 · 0 评论 -
Nutch中使用自定义中文分词器
Nutch中使用自定义中文分词器 Nutch对中文查询时默认采用的分词器为NutchAnalyzer,对中文默认采用单字切分.这种效果不是很理想,我们可以自定义切词器,以实现对中文支持. 通常可以采用的两种方式添加对中文的支持: 1.采用插件的方式,不修改系统代码的基础上,编写中文分词插件实现对中文分词的支持。 2.直接修改nutch的系统代码,对默认的分词器代码进行修改使其使用自...原创 2010-09-06 16:34:13 · 244 阅读 · 0 评论