爬行者LARM---Lucene

爬行者LARM是用纯Java编写的网页抓取机器人,作为Lucene子项目还在开发中,文档说明不统一。其源码有GUI界面但部分功能未实现。不考虑与Lucene关系,它有一定使用价值,文中还给出了获取、编译和运行该项目的相关命令。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

来自:http://hedong.3322.org/archives/000218.html   车东

 爬行者LARM是一个抓取网页的机器人,用纯Java写就。

  通过作者的叙述,写一个爬行者,远非想象中的那么简单。HTML规范太简单了,所以会出很多标新立异的HTML文件。网络的随机性太强了,说不定就会遇到什么问题。这种种意外,都会考验一个爬行者。

  LARM作为Lucene的子项目,还在开发之中,连个稳定版都没有,只能通过CVS取得。而且文档的说明也不统一,具有开发中的项目的共性。不过,它的随机文档还是把LARM的设想和特点说了,它还有一个wiki页面,不知为什么在sourceforge上还挂了一个名(这儿还有几篇RTF文档)。

  LARM源码中,有一个GUI界面,把我乐坏了,一运行,怎么点击“Start”它也不活动,很郁闷,一看源码,“// to do: code goes here.”,根本没有对这个点击事件的处理代码。FT!

  如果不考虑它与Lucene的关系,单当作一个爬行者来看,也有一定的使用价值。我下了这个项目,编译运行以后,对http://hedong.3322.org进行抓取,由于没限制域名,一下子到了5500多个域名,在下了300M左右,就把它中断了。

mkdir jakarta
cd jakarta

cvs -d :pserver:anoncvs@cvs.apache.org:/home/cvspublic login
password: anoncvs
cvs -d :pserver:anoncvs@cvs.apache.org:/home/cvspublic checkout jakarta-lucene-sandbox

cd jakarta-lucene-sandbox/contributions/webcrawler-LARM
ant dist

把build/webcrawler_LARM-0.5.jar及libs/目录下的所有jar都加到classpath里去。

java -server de.lanlab.larm.fetcher.FetcherMain -start http://hedong.3322.org

在Qt中使用CMSIS-DSP库,可以通过以下步骤进行配置和集成: 1. 下载CMSIS-DSP库:从ARM官方网站上下载CMSIS-DSP库的压缩包,并解压到本地目录。 2. 创建Qt项目:在Qt Creator中创建一个新的Qt项目。 3. 将CMSIS-DSP库添加到项目中:将CMSIS-DSP库中的头文件(.h文件)和源文件(.c文件)添加到Qt项目中。可以在Qt Creator中的项目资源管理器中右键点击项目名称,选择"添加现有文件",并选择CMSIS-DSP库的头文件和源文件。 4. 在.pro文件中添加相关配置:在Qt项目的.pro文件中添加必要的配置,以链接CMSIS-DSP库。例如,可以使用类似以下的语句: ``` INCLUDEPATH += /path/to/cmsis_dsp_library LIBS += -L/path/to/cmsis_dsp_library -larm_cortexM4lf_math ``` 这里的 "/path/to/cmsis_dsp_library" 是CMSIS-DSP库的路径,根据实际情况进行替换。 5. 在Qt代码中使用CMSIS-DSP函数:在Qt项目的代码中,包括所需的头文件,并使用CMSIS-DSP库提供的函数进行信号处理、滤波、FFT等数字信号处理任务。 需要注意的是,CMSIS-DSP库是为ARM Cortex-M处理器优化的。在使用CMSIS-DSP库时,需要确保目标平台与库所针对的处理器兼容。 以上是使用CMSIS-DSP库的基本步骤,具体的集成过程可能会因项目和平台的不同而有所变化。建议参考CMSIS-DSP库的官方文档和Qt的相关文档,以便更详细地了解如何在Qt中使用CMSIS-DSP库。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值