
Nutch
chlstar
这个作者很懒,什么都没留下…
展开
-
nutch1.2导入到eclipse
1.测试环境 nutch1.2 eclipse Version:Indigo Service Release 1 Buildid: 20110916-0149 ubuntu11.10 jdk1.7 下载nutch1.2的源码http://nutch.apache.org/#24+September+2010+-+Apache+Nutch+1.2+Released 2.将nutch导翻译 2012-01-30 21:36:23 · 1226 阅读 · 2 评论 -
linux下搭建nutch-1.3
我的安装环境Red Hat Enterprise Linux5,jdk6,tomcat6。 1. 环境需求 1.1 Sun JDK 1.5 or 更高版本,设置NUTCH_JAVA_HOME为您的JVM安装的根。 1.2 Apache’s Tomcat 5.x or 更高版本。 1.3 1Gb的硬盘空间 2. 准备开始 首先你需要得到n翻译 2012-01-02 15:56:57 · 785 阅读 · 0 评论 -
nutch分类搜索
<!-- @page {margin:2cm} p {margin-bottom:0.21cm} a:link {} --> Nutch分类搜索 环境 ubuntu11.10 tomcat6.0.35 nutch1.2 笔者想到的分类搜索的方法是根据不同的url建立不同的抓取库,比如要搞电力行业的垂直的搜索,可以将他分为新闻,产品,人才。那麽就建立三个抓原创 2012-01-01 21:02:53 · 1653 阅读 · 0 评论