- 博客(2)
- 资源 (3)
- 收藏
- 关注
原创 基于HTMLUnit的微博爬虫
介绍 常用爬虫开源项目 新浪微博爬虫和腾讯微博爬虫 新浪爬虫的问题 总结 介绍 相关简介 即网络爬虫,是一种自动获取网页内容的程序。是搜索引擎的重要组成部分,因此搜索引擎优化很大程度上就是针对爬虫而做出的优化。 主要分类 网络爬虫为搜索引擎从万维网下载网页。一般分为传统爬虫和聚焦爬虫。 传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在
2015-05-05 16:59:04
2031
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅