在Hadoop上部署nutch 及nutch相关

本文介绍了如何在Hadoop上部署Nutch,并提供了详细的Nutch学习笔记和官方教程链接,包括Nutch本地模式配置、与Solr的集成、REST API概述以及从源代码分布安装的高级选项。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  1. nutch启动入口,bin/crawl  调用 bin/nutch。
  2. nutch系列学习笔记,详细解读nutch每个tool:http://blog.youkuaiyun.com/gobitan/article/category/284793
  3. 官方wiki:http://wiki.apache.org/nutch/FrontPage#Nutch_1.X_tutorial.28s.29
  4. 官方教程:http://wiki.apache.org/nutch/#Tutorials 
  5. Nutch 1.X tutorial(s)


  6. Nutch and Hadoop Tutorial   (found on google)https://wiki.apache.org/nutch/NutchHadoopTutorial

  7. Option 2: Set up Nutch from a source distribution

    Advanced users may also use the source distribution:

    • Download a source package (apache-nutch-1.X-src.zip)

    • Unzip
    • cd apache-nutch-1.X/

    • Run ant in this folder (cf. RunNutchInEclipse)

    • Now there is a directory runtime/local which contains a ready to use Nutch installation.

    When the source distribution is used ${NUTCH_RUNTIME_HOME} refers to apache-nutch-1.X/runtime/local/. Note that

    • config files should be modified in apache-nutch-1.X/runtime/local/conf/

    • ant clean will remove this directory (keep copies of modified config files)



  8. 在Hadoop上运行:http://wiki.apache.org/nutch/NutchHadoopSingleNodeTutorial
  9. 看起来比较靠谱的“Nutch+Hadoop集群搭建” http://www.open-open.com/lib/view/open1328670771405.html
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值