python批量爬取网页图片的初步实现

本文分享了使用Python网络爬虫技术爬取网页图片的实践过程,包括获取HTML、提取图片链接及保存图片到本地的方法。通过具体案例,详细介绍了如何处理常见错误并优化代码。

最近本人正在学习python网络爬虫,尝试实现爬取网页图片,通过对网上一些相关博客的学习,目前初步实现,分享一下实现代码。

爬取图片的目标网页是https://findicons.com/pack/2787/beautiful_flat_icons
在这里插入图片描述

1. 获取html

import requests 
import urllib.request
import re

html = requests.get('https://findicons.com/pack/2787/beautiful_flat_icons')
encoding = html.apparent_encoding #获取该页面的字符集编码类型
html.encoding = encoding #使用该编码类型来对页面编码
text = html.text

2. 从html内容中提取图片链接

text_splited = re.split(r'\s+',text) #将html内容按空格分割为一个列表
target = []
target_index = []

for i in text_splited:
    if(re.match(r'src',i)):
        if(re.match(r'.*?png',i)):
            target.append
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值