- 博客(7)
- 收藏
- 关注
原创 Strust组件—RequestProcessor类详解
from: http://www.cnblogs.com/bianshencho/archive/2009/09/27/1575082.html 对于RequestProcessor这个类,有的人可能很陌生,毕竟它不象ActionSerlvet那样,在我们的面前频繁的出现。但是,RequestProcessor用的要远比ActionServlet多,那么RequestProcessor到底...
2010-09-08 15:11:02
178
原创 一个不错的nutch使用文档
一个不错的nutch使用文档2007-10-26 10:19基本上把思路理清了一、安装nutch和配置tomcat,注意nutch0.7和0.8的区别,在这里以0.7版本为例二、抓取网页,建立搜索 1、假设当前目录为nutch目录,建立一个urls文件,内容就是要抓取的网站域名,如http://www.mydomain.com,可以有多个,每行写一个。在试验中发现,只有根域名有时候...
2010-09-08 10:36:33
179
原创 Nutch在Windows中安装之细解[组图]
Nutch在Windows中安装之细解 近来Nutch一词在网络中时有所见,但囿于平常工作繁忙而未能潜心细读与研究,只知道Nutch是Apache组织的一个开源项目,利用它用户可以建立自己内部网的搜索引擎,也可以建立针对整个网络的搜索引擎。好在春节假日期间,终于得空可以从容对其进行一番解读与测试了。在使用Nutch之前,当然是需要先对其进行安装了。用搜索引擎查找了一下相关内容...
2010-09-08 10:35:47
139
原创 Nutch 使用之锋芒初试[组图]
Nutch 使用之锋芒初试 “工欲善其事,必先利其器。”经过前文的“细解”,我们已经完成了Nutch在Windows中的安装。接下来就让我们通过锋芒初试,来亲自体验一下Nutch的强大功能吧! Nutch的爬虫抓取网页有两种方式,一种方式是Intranet Crawling,针对的是企业内部网或少量网站,使...
2010-09-08 10:32:52
155
原创 Nutch使用方法简介
Nutch使用方法简介 目前Nutch采用Sehll的启动方式,如果您使用的是Windows系统,那么首先需要安装Cygwin。本文就以在Windows中为例,介绍Nutch的安装和使用方法。 (1)准备需要的软件列表 Cygwin (下载地址:http://www.cygwin.com/setup.exe) Jdk(1.4.2以...
2010-09-08 10:29:26
203
原创 Lucene入门与使用[转]
Lucene入门与使用(一) [转]本文主要面向具体使用,适用于已熟悉java编程的lucene初学者。1. Lucene的简介1.1 Lucene 历史org.apache.lucene包是纯java语言的全文索引检索工具包。Lucene的作者是资深的全文索引/检索专家,最开始发布在他本人的主页上,2001年10月贡献给APACHE,成为APACHE基金jakar...
2010-09-08 10:28:02
141
原创 Nutch使用调研报告
这是半年前使用Nutch的时候写的.本文讲述了如何搭建一个可运行的Nutch系统.Nutch是个开源的建立搜索引擎的项目,功能很强大,有时间去研究研究还是很好的.一.Nutch的安装 Nutch的安装比较简单,下面介绍在Linux下的安装步骤:(在Windows下也能运行,不过先得安装cygwin,一个在windows环境下模拟Linux的软件,具体安装步骤见 二.Cygwi...
2010-09-08 10:26:20
122
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人