java 爬虫 简单的图片爬取

本文介绍如何使用Java结合Jsoup库进行图片爬取。通过分享爬虫实现过程,探讨爬虫的乐趣,并欢迎大家交流讨论。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

用java爬取图片需要导入jsoup的jar包,感觉爬虫挺有意思的,做出来跟大家分享一下! 

import java.io.File;
import java.net.URL;
import org.apache.commons.io.FileUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class PaQuTuPian {//爬去图片 首先需要导入jsoup的jar包
	public static void main(String[] args) throws Exception {
		String url = " ";//双引号里内容为你要爬去的网站url 此处略过
		Document document = Jsoup.connect(url).post();//获取url网站html内容
		//获取html里所有class值为"block"的属性的内容   getElementsByTag("") 用来获取标签 如img src 等
		Elements elements = document.getElementsByClass("block");
		for (int i = 0; i < elements.size(); i++) {//循环输出
			Element yuansu= elements.get(i);//用来获取单条class为"block"的内容
			Elements yuansu_zi = yuansu.getElementsByTag("img");//获取class为"block"的子元素为img的内容
			String imgurl = yuansu_zi.attr("src");//获取img中src属性值
			String imgname = yuansu.attr("title");//获取class为"block"中src属性值
			//调用方法
			paQu(imgurl, "E:/img/", imgname);//第一个参数为要下载的图片路径 第二个为存放的路径 第三个为图片的名字
		}
	}
	public static void paQu(String imgurl,String dizhi,String imgname) throws Exception{
		URL url = new URL(imgurl);//创建url类
		String path =dizhi+imgname+".jpg"; //图片的名字  后缀名必须弄好
		File file = new File(path);
		FileUtils.copyURLToFile(url, file);//下载为url的图片地址  同时将下载好的图片存入到file的地址中
		System.out.println("读取成功");
	}
}

 有什么注释不好的地方,欢迎指出,谢谢!

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值