
爬虫
酷酷的糖先森
当你的才华还撑不起你的野心时,那就应该静下心来学习吧。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
邮箱扒头像来告诉你怎么写简单的脚本扒图
摘要 手上有几十万邮箱,本来用户系统没有做头像的东西,现在想根据这些邮箱能拿一部分用户的头像,可以直接使用 gravatar的服务,不过这玩意儿不时会被墙,还是拉回来靠谱,第2个途径是qq邮箱,通过分析数据发现,这几十万 用户里面居然有一半以上是qq邮箱,so 要想办法通过不用oauth的方式拿到. 爬虫 目录[-] 用邮箱扒头像来告诉你怎么写简单的脚本扒图 思原创 2014-12-05 14:32:10 · 2641 阅读 · 0 评论 -
JAVA爬虫 WebCollector
爬虫简介: WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。 爬虫内核: WebCollector致力于维护一个稳定、可扩的爬虫内核,便于开发者进行灵活的二次开发。内核具有很强的扩展性,用户可以在内核基础上开发自己想要的爬虫。源码中集成了Jsoup,可进行精准的网页解析。 量级:原创 2014-12-03 21:08:13 · 2492 阅读 · 0 评论