在eclipse-SDK-4.2-win32-x86_64中构建Heritrix1.14.4

本文详细介绍了如何使用Heritrix1.14.4进行Java爬虫开发,包括下载、配置、导入依赖、修改配置文件及运行流程等关键步骤。通过实际操作演示,帮助开发者快速上手。

听到大家说:"java爬虫"。只觉得真陌生啊,不过很有兴趣。做个了解。这里用的版本是Heritrix 1.14.4(2010年5月10日的版本 目前是最新版本),差了很多的网上资料,发现以下步骤,不过我可是把工程删了建,建了删啊,只能说明自己太水了。哈哈,废话不多说,上酸菜:

 1.从http://sourceforge.net中搜索下载 :heritrix-1.14.4.zip 和 heritrix-1.14.4-src.zip ,分别对 heritrix-1.14.4.zip 和heritrix-1.14.4-src.zip 进行解压 

2.在MyEclipse 中创建一个java project的工程Heritrix_test(工程的名字可以自己定)。 

3.将heritrix-1.14.4-src.zip解压后文件夹下的src/java 中的 com、org、st三个文件夹复制到项目Heritrix_test的src下。

 4.将heritrix-1.14.4-src.zip解压后文件夹下src中conf文件夹复制到项目Heritrix_test的根目录下。

 5.将heritrix-1.14.4-src.zip解压后文件夹下lib文件夹复制到项目Heritrix_test的根目录下。

 6.将heritrix-1.14.4-src.zip解压后文件夹下src/resources/org/archive/util中tlds-alpha-by-domain.txt文件复制到项目Heritrix_test中src/org.archive.util包下。 7.将heritrix-1.14.4.zip解压中webapps文件夹复制到项目Heritrix_test的根目录下。

 8.将heritrix-1.14.4-src.zip解压中src/webapps文件夹下的两个文件夹复制到项目Heritrix_test的webapps目录下

 9.对配置文件进行修改,找到项目中conf下heritrix.properties文件 ,修改如下: //设置版本 heritrix.version = 1.14.4 //设置用户密码 heritrix.cmdline.admin = admin:admin //设置端口 heritrix.cmdline.port = 8080 *(端口号一般是给定了的,可以不用再修改) 

10.接下来将jar包导入项目。右键单击Heritrix项目,选择Build Path->Configure Build Path,选中 Libraries选项,选择Add External JARS,将heritrix-1.14.4/lib下的所有jar包加入到Build Path。

 11. 在Window->Preference->Java->Compiler中,将Complier compliance level改为1.5,目的是为了使Heritrix编译通过。否则Eclipse可能不认assert这个关键字。(这个很关键,要不然会报错的)

 12.进入Windows -> Preferences -> Java -> Compiler -> Errors/Warnings-> Deprecated and trstricted API -> Forbidden reference (access rules): -> change to warning,如果不做这一步,会在org.archive.crawler包中Heritrix.java出现sun.net.www.protocol.file.FileURLConnection的错误。这是因为是sun包是受保护的包,默认为只有sun公司的软件才能使用,对受保护的包使用warning即可。 

13.在工程中找到org.archive.crawler.Heritrix.java右键选Run as—>Run Configurations运行配置 选择Classpath 选择User Entries -- Advanced 选择Add Folders 将conf文件夹添加进去。 点击Run 开始运行 启动成功,控制台打印

12:06:11.703 EVENT  Starting Jetty/4.2.23
12:06:12.125 EVENT  Started WebApplicationContext[/,Heritrix Console]
12:06:12.265 EVENT  Started SocketListener on 127.0.0.1:8080
12:06:12.265 EVENT  Started org.mortbay.jetty.Server@53f0a8
Heritrix version: 1.14.4

14 运行http://localhost:8080,出现登录页面,输入用户名:admin,密码:admin登录成功,标明配置成功

上图:


内容概要:本文介绍了一个关于超声谐波成像中幅度调制聚焦超声所引起全场位移和应变的分析模型,并提供了基于Matlab的代码实现。该模型旨在精确模拟和分析在超声谐波成像过程中,由于幅度调制聚焦超声作用于生物组织时产生的力学效应,包括全场的位移与应变分布,从而为医学成像和治疗提供理论支持和技术超声谐波成像中幅度调制聚焦超声引起的全场位移和应变的分析模型(Matlab代码实现)手段。文中详细阐述了模型构建的物理基础、数学推导过程以及Matlab仿真流程,具有较强的理论深度与工程应用价值。; 适合人群:具备一定声学、生物医学工程或力学背景,熟悉Matlab编程,从事医学成像、超声技术或相关领域研究的研究生、科研人员及工程技术人员。; 使用场景及目标:①用于超声弹性成像中的力学建模与仿真分析;②支持高强度聚焦超声(HIFU)治疗中的组织响应预测;③作为教学案例帮助理解超声与组织相互作用的物理机制;④为相关科研项目提供可复用的Matlab代码框架。; 阅读建议:建议读者结合超声物理和连续介质力学基础知识进行学习,重点关注模型假设、偏微分方程的数值求解方法及Matlab实现细节,建议动手运行并修改代码以加深理解,同时可拓展应用于其他超声成像或治疗场景的仿真研究。
### 关于PAT Basic Level Practice的测试点及题目解析 #### 题目难度分级 PAT(Programming Ability Test)是由浙江大学举办的计算机程序设计能力考试,分为不同级别。其中乙级即Basic Level主要面向初学者,考察基本编程技能[^1]。 #### 测试点特点 对于PAT Basic Level中的某些特定题目而言,其测试点设置较为严格。例如,在处理字符串匹配类问题时,需要注意算法逻辑中何时应当终止循环以防止不必要的重复计算;而在涉及数值运算的问题里,则可能因为边界条件而增加复杂度[^3]。 #### 编程语言的选择影响 值得注意的是,尽管大部分简单题目可以作为学习某种新语言的良好实践材料,但在实际操作过程中可能会遇到由于所选语言特性而导致难以通过全部测试点的情况。比如Java在面对部分效率敏感型试题时表现不佳,这可能是由于该语言本身的执行速度相对较慢以及内存管理方式等因素造成的。因此有时不得不转而采用其他更适合解决此类问题的语言版本来完成解答[^2]。 ```cpp #include<bits/stdc++.h> using namespace std; int a[100000]; int c=1; void getPrime(){ int flag=0; for(int i=2;i<105000;i++){ flag=1; for(int j=2;j<=sqrt(i);j++){ if(i%j==0){ flag=0; break; } } if(flag==1) a[c++]=i; } } int main(){ int m,n,i,t=1; scanf("%d %d",&m,&n); getPrime(); for(i=m;i<=n;i++){ if(t%10==1){ printf("%d",a[i]); t++; }else{ printf(" %d",a[i]); t++; } if((t-1)%10==0) printf("\n"); } return 0; } ``` 上述C++代码展示了如何实现一个简单的质数打印功能,并且针对输出格式进行了特殊处理以满足特定要求。这段代码很好地体现了编写高效解决方案的重要性,尤其是在应对像PAT这样的在线评测系统时[^4]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值