如果需要按照以上这篇文章安装,其源zip文件下载地址为:
http://sourceforge.net/projects/archive-crawler/files/archive-crawler%20%28heritrix%201.x%29/
如果觉得麻烦,可以直接下载下面这个我已经配置好的工程包。
第一步,将下载后的.zip文件解压,将解压得到的Heririx文件夹剪切到你的workspace中。
第二步,新建Java Project,注意Project的名字一定要和工程名相同,本例中是Heritrix(你可以看到输入"Heritrix"后很多选项都灰化了),点击finish。
第三步,这样就把工程导入到了Eclipse中。
有人会问,为什么不直接import--General--Existing Projects into Workspace导入到eclipse中。原因很简单,我上传的那个包中不包含.classpath和.project这两个隐藏文件,所以eclipse根本无法识别。
第四步,导入后会看到工程下有很多红色的叉!不要急,是因为还没有导入jar包。
右键点击工程---Build Path----Configure Build Path,切换到Libraries栏,选择"Add Extern JARS....",然后browser到刚解压文件夹Heritrix目录下的lib目录。按住Ctrl+A,然后点ok,全部加入。
最后,在org.archive.crawler包下右键点击运行Heritrix.java,执行!还有什么问题请留言!
下载地址:
(1)http://u.163.com/DI30vu提取码:o0ukqour
(2)http://download.youkuaiyun.com/source/3425244