
CrawlScript---JAVA编写的爬虫脚本语言
文章平均质量分 77
AJAXHu
这个作者很懒,什么都没留下…
展开
-
自己动手做网络爬虫系列——1
网络爬虫(又被称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁,自动索引,模拟程序或者蠕虫。 相信很多人都用JAVA或者C++写过网络爬虫,但是都存在代码过于复杂、爬虫难以维护的问题。也有很多人使用脚本语言编写过网络爬虫,但是这些脚本很多时候不妨变嵌入大型的系统,或者语法怪异,难以上手。 我们教原创 2014-01-15 14:58:37 · 4928 阅读 · 1 评论 -
CrawlScript语言轻松实现网络爬虫——轻松爬取整站信息
CrawlScript语言在beta0.3版本中集成了整站爬虫的功能,只需要简单几句,就可以完成对整站的爬取。 首先下载CrawlScript beta 0.3: CrawlScript beta 0.3版及demo下载。 下载后解压,在CrawlScript-bin文件夹中有一个demo.js,这个代码虽然只有几行,但是实现了对整个新华网的新闻正文的爬取和抽取,一原创 2014-01-21 00:16:15 · 3685 阅读 · 0 评论 -
CrawlScript爬虫脚本语言QQ群及邮箱
CrawlScript爬虫脚本语言官方QQ群:250108697CrawlScript爬虫脚本语言官方邮箱:briefcopy@126.com想获取更多入门教程,加QQ群或发邮件加入交流,欢迎新人!原创 2014-01-20 23:20:27 · 2130 阅读 · 0 评论