
java爬虫
文章平均质量分 78
wangquanjava
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
使用Java爬虫得到优快云博客信息并保存(一)
1.需求: 上一篇文章已经可以得到博客中的信息,这篇博客将示范把信息以txt文件的形式保存到本地2. 代码实现:package cn.test12.WebRobot04;import java.io.BufferedWriter;import java.io.File;import java.io.FileOutputStream;import ja原创 2015-11-03 22:33:00 · 404 阅读 · 0 评论 -
使用Java爬虫得到优快云博客信息并保存(一)
1.需求: 使用java爬虫得到blog.youkuaiyun.com首页的所有出现的博客地址,并逐个访问,把博客信息保存到本地。2.思路: (1).通过URL类的方法得到首页的HTML源码,使用正则把博客的url都放到一个String数组中 (2).再逐个访问个人博客的首页得到HTML源码,使用正则提取到需要的信息 (3).使用IO把得到原创 2015-11-03 22:31:43 · 586 阅读 · 0 评论