python爬取图片并保存到本地

最新推荐文章于 2025-05-26 15:55:25 发布

一颗大白菜_20181203

最新推荐文章于 2025-05-26 15:55:25 发布

阅读量1.1w

点赞数 6

CC 4.0 BY-SA版权

分类专栏：业余小爱好文章标签：爬虫 request+bs4

本文链接：https://blog.youkuaiyun.com/qq_38796310/article/details/85064500

本文介绍了如何使用Python的requests和BeautifulSoup库爬取网页上的图片，并将这些图片保存到本地。通过运行程序，可以在当前目录看到不断生成的包含图片的文件夹。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Python爬取图片(你懂得)

requests与Bs4

这两个模块是本文使用的主要模块，requests可以获取连接，bs4全名BeautifulSoup，是编写python爬虫常用库之一，主要用来解析html标签。这两个模块可以通过cmd终端下载

pip install bs4
pip install requests

代码实现

import requests
from bs4 import BeautifulSoup
import os
class Mzitu():
    def __init__(self):
        self.headers = {
   
   
            'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36'
        }# 构造请求头，主网站的请求头较为简单只需构造浏览器头
        self.base_path = os.getcwd() # 获取当前路径

    def get_url(self,html):
    '''获取每个套图的链接，并返回'''
        html_b=BeautifulSoup(html,'lxml')
        urls_b = html_b.find_all('ul',attrs={
   
   'id':'pins'})[0]
        urls = urls_b.find_all('a')
        for i in urls:
            yield i['href']

    def get_img_url_max(self,url):
    '''获取图片的张数'''
        html_i = requests.get(url,headers=self.headers)