
spider
iteye_11711
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Arachnid Web Spider Framework的使用
在论坛上面看到一个爬虫工具Arachnid Web Spider Framework,看了一下源代码,相当的简练和漂亮。所以决定在这个上面做点东西出来1.实现除html以外的页面的检索和分析,例如wap网页等,做成基于手机的搜索引擎。2.把tomcat,j2sdk等嵌入到代码中,并嵌入简单的纯java的数据库,例如hsqldb,完善爬虫功能。3.制作一个图形换的管理控制台,可以对抓取的范...2007-09-11 10:22:06 · 283 阅读 · 0 评论 -
Arachnid Web Spider Framework1
Arachnid Web Spider Framework的文档只有一个英文的,如下Arachnid Web Spider FrameworkDescriptionArachnid is a Java-based web spider framework. It includes a simple HTML parser object that parses an input stream...2007-09-11 10:24:35 · 253 阅读 · 0 评论 -
Arachnid Web Spider Framework2
PageInfo.java是一个页面对象。它抽象了页面的主要元素,并且封装了取得那些元素的方法。public URL getUrl() { return(url); }\\取得页面的url public URL getParentUrl() { return(parentUrl); }\\ public String getTitle() { return(title); } pu...2007-09-12 11:33:00 · 141 阅读 · 0 评论