一个简单的python程序,28行代码,实现简单网站的图片爬取

本文介绍了一个使用Python编写的简单图片爬虫程序,通过28行代码实现从指定URL下载所有图片。程序首先设置URL和请求头,接着获取网页内容,然后利用正则表达式匹配图片链接。最后,程序使用for循环下载图片,并创建文件夹,进行图片命名和显示下载进度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.导入基本的urllib的库,以及re.os.time的库.
import urllib.request
import urllib.parse
import re
import os
import time

2.设置url和headers.

image_url = 'http://www.youmei8.com/meizitu/1859.html'
headers = {
	'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36',
}

3.获取网页.

request = urllib.request.Request(url = image_url, headers = headers)
response = urllib.request.urlopen(request)
response = response.read().decode()
# print(response)

4.正则匹配当前网页所有图片链接.

pattern = re.compile(r'.*?<img alt="" src="(.*?)".*?>.*?', re.S)
lt = pattern.findall(response)
# print(lt)

5.for循环下载所有的图片,以及创建文件夹和图片命名和提示信息.

for img in lt:
	imgname = img.split('/')[-1]
	dirname = '白色蕾丝装'
	if not os.path.exists(dirname):
		os.mkdir(dirname)
	img_name = dirname + '/' + imgname
	print('%s图片正在下载...' % imgname)
	urllib.request.urlretrieve(img, img_name)
	print('%s图片下载完成...' % imgname)
	time.sleep(1)
print('%s专辑下载完成' % dirname)

dirname为文件名,url为http://www.youmei8.com/的专辑链接.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值