配置之后的工作空间目录结构如下:
1、下载heritrix-1.14.4-src.zip和heritrix-1.14.4.zip 这两个文件,并解压
2、以heritrix-1.14.4-src/heritrix-1.14.4/src/java为目录建工程
3、将G:/×××/Hertrix/heritrix-1.14.4/heritrix-1.14.4下的heritrix-1.14.4.jar文件解压缩,然后复制到java文件夹中,复制过程中选择覆盖
4、将G:/×××/Hertrix/heritrix-1.14.4/heritrix-1.14.4下的lib文件夹都复制到Java文件夹中,便于以后导入全部jar包
5、将G:/×××/Hertrix/heritrix-1.14.4/heritrix-1.14.4下的webapps文件夹复制到java文件夹中,便得到如图所示的。
6、新建一个java project ,从已有的文件中导入,如下:
7、然后保存。将java文件夹重命名为Heritrix,复制到已有的workspace中。
8、修改项目根目录下的heritrix.properties文件,主要是修改红色部分,如下:
9、项目/src/org.archive.crawler包下Heritrix.java上点击右键选运行方式->运行。
10、运行结果为:
11、设置成功!!!