jsoup下载图片

本文提供了一个使用Java实现的简单网页图片爬虫代码示例。该示例利用Jsoup库解析网页源代码并获取所有图片链接,通过多线程方式下载图片到本地指定目录。代码展示了如何设置HTTP请求头、处理异常以及确保资源正确关闭。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

package test;

import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.URL;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class download {
	public static int num = 0;

	public static void main(String[] args) throws IOException {
		Document doc = Jsoup.connect("").get();
		Elements elements = doc.select("img[src]");
		for (Element element : elements) {
			String imgUrl = element.attr("src");
			System.out.println(imgUrl);
			if (!imgUrl.startsWith("http://")) {
				imgUrl = "http:" + imgUrl;
			}
			new Thread(new download().new DownLoadThread(imgUrl)).start();
		}
	}

	public class DownLoadThread implements Runnable {
		private String imgUrl;

		public DownLoadThread(String url) {
			this.imgUrl = url;
		}

		@Override
		public void run() {
			FileOutputStream out = null;
			HttpURLConnection conn = null;
			try {
				URL url = new URL(imgUrl);
				conn = (HttpURLConnection) url.openConnection();
				conn.setRequestMethod("GET");
				conn.setReadTimeout(5 * 1000);
				InputStream inputStream = conn.getInputStream();
				// imgUrl.replaceAll("\\", "_").replaceAll("http:", "");
				String fileName = "e:\\photo\\"+num++ + ".jpg";
				out = new FileOutputStream(new File(fileName));
				byte[] arr = new byte[1024];
				int len = 0;
				while ((len = inputStream.read(arr)) != -1) {
					out.write(arr, 0, len);
				}
				System.out.println("=====处理完成====");
			} catch (Exception e) {
				e.printStackTrace();
			} finally {
				if (out != null) {
					try {
						out.close();
					} catch (IOException e) {
						e.printStackTrace();
					}
				}
				if (conn != null) {
					conn.disconnect();
				}

			}
		}

	}
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值