java爬虫
零零叁2019
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
java爬虫(一)--下载html
需要的包Jsoup1.6.jar效果图: 第一步、先建一个类,将操作部分封装,传入网址u和目录mkdpublic class DownLoadPage { public static void downloadPage(String u,String mkd){ }}1.1 传入的网址不一定是域名格式,需要我们解析成域名URL url=new URL(...原创 2018-04-08 21:47:35 · 1527 阅读 · 3 评论 -
Java 爬虫(二)
在前面的基础上做了一点修改,直接上源码,代码有注释package test;import java.io.BufferedReader;import java.io.BufferedWriter;import java.io.File;import java.io.FileOutputStream;import java.io.InputStreamReader;import...原创 2018-04-15 11:20:46 · 210 阅读 · 0 评论 -
Java爬虫(三)--获取网页中的所有地址
在这里就懒得处理异常,代码很简单,看注释package test;import java.net.URL;import java.util.ArrayList;import java.util.List;import java.util.regex.Matcher;import java.util.regex.Pattern;import org.jsoup.Jsoup;...原创 2018-04-15 12:19:25 · 1052 阅读 · 0 评论
分享