今天了解了一下爬虫技术,对于java爬虫,主要有webmagic,jsoup,httpclient。这些都需要去下载jar包,要么这个包少了,要么那个包少了很麻烦,而且网上也不好下载完整版。
所以了解了爬虫技术思想后,利用java自带的库写了一个小程序实现从网上爬图(只能爬静态网页)。
一.分析网页源代码
我选的是我的女神绫濑遥的图片,按F12打开网页源代码;找到图片容器。
找到图片链接
二.下载整个页面
今天了解了一下爬虫技术,对于java爬虫,主要有webmagic,jsoup,httpclient。这些都需要去下载jar包,要么这个包少了,要么那个包少了很麻烦,而且网上也不好下载完整版。
所以了解了爬虫技术思想后,利用java自带的库写了一个小程序实现从网上爬图(只能爬静态网页)。
一.分析网页源代码
我选的是我的女神绫濑遥的图片,按F12打开网页源代码;找到图片容器。
找到图片链接
二.下载整个页面