抓取网络图片下载到本地

该博客主要围绕抓取网络图片并下载到本地展开,虽未给出具体内容,但核心是实现网络图片的抓取与本地存储,涉及信息技术中数据采集和文件处理相关操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

#coding:utf-8
import urllib.request
import re
import os

def open_url(url):
	#请求url
	req=urllib.request.Request(url)
	#设置请求头,简单地防止网站识别出爬虫
	req.add_header("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36")
	#读取所有的html元素
	html=urllib.request.urlopen(req).read()
	return html
	
def get_links(url):
	html=open_url(url)
	#正则匹配img src="xxx",尽可能少的匹配,懒匹配,匹配到第一个就停止
	r=re.compile('img src="(.*?)"')
	#从html元素里面找到 img src="xxx"
	result=r.findall(html.decode("utf-8"))
	#切换到d盘,这是保存图片的位置
	os.chdir("d:/")
	for img in result:
		#分离名字,[-1]是取最后一个
		filename=img.split("/")[-1]
		#保存图片
		with open(filename,"wb") as f:
			img=open_url(img)
			f.write(img)

if __name__=="__main__":
	#url="http://www.soupan.info/"
	url="http://jandan.net/ooxx/page-2017#comments"
	get_links(url)

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值