Nutch + Solr + Hadoop 搭建分布式搜索引擎详细文档
经过几天的摸索,终于完全成功地把环境搭建好了,这个过程遇到各种问题,并且目前网上没有一个完全可行的详细环境搭建教程,所以这里专门写一个详细的文档作为记录,这里主要记录nutch 的配置。
环境:Linux 3.14.2 x86_64, JDK 1.7.0.51 x86_64
先安装好JDK, Hadoop,配置好环境变量,可以参考网上教程,这里不写了。保证java 和 Hadoo
经过几天的摸索,终于完全成功地把环境搭建好了,这个过程遇到各种问题,并且目前网上没有一个完全可行的详细环境搭建教程,所以这里专门写一个详细的文档作为记录,这里主要记录nutch 的配置。
环境:Linux 3.14.2 x86_64, JDK 1.7.0.51 x86_64
准备: hadoop 2.4.1 ,
apache-nutch-2.2.1-src.tar.gz (http://www.apache.org/dyn/closer.cgi/nutch/2.2.1/apache-nutch-2.2.1-src.tar.gz),
solr-4.10.2.tgz(http://apache.petsads.us/lucene/solr/4.10.2),
apache-tomcat-6.0.43.tar.gz(http://tomcat.apache.org/download-60.cgi#6.0.43),
apache-ant-1.9.4-bin.zip(http://www.webhostingjams.com/mirror/apache//ant/binaries/apache-ant-1.9.4-bin.zip)
IK Analyzer 2012FF_hf1(IK Analyzer 2012FF_hf1http://ik-analyzer.googlecode.com/files/IK%20Analyzer%202012FF_hf1.zip先安装好JDK, Hadoop,配置好环境变量,可以参考网上教程,这里不写了。保证java 和 Hadoo