用python2.7的requests模块下载图片（案例是200张）

最新推荐文章于 2025-06-08 21:56:05 发布

Acm.

最新推荐文章于 2025-06-08 21:56:05 发布

阅读量927

点赞数 1

CC 4.0 BY-SA版权

分类专栏： python 爬虫文章标签： python 爬虫

本文链接：https://blog.youkuaiyun.com/weixin_43187141/article/details/82792395

python 同时被 2 个专栏收录

18 篇文章

订阅专栏

爬虫

5 篇文章

订阅专栏

本文介绍如何使用Python的requests模块从Unsplash网站批量下载花卉图片，通过设置参数实现200张图片的爬取与保存，代码中包含了去重和文件命名的处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

用python2.7的requests模块下载图片（案例是200张）

想要增加数据量自己改参数就行了。

其中是有些数据重复，可能不到200，但是不会差太远。

# -*- coding: utf-8 -*-

# @Author  : Acm
import json

import jsonpath
import requests

base_url = "https://unsplash.com/napi/search/photos?"

headers = {"User-Agent": "Mozilla/5.0 (Linux; Android 5.0; SM-G900P Build/LRX21T) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.81 Mobile Safari/537.36"}

j = 1
# 链接地址
url_list = []

# 加参数
for i in range(10):
    params = {
        "query": "flower",
        "xp": "",
        "per_page": 20,
        "page": i,
    }

    # 请求数据
    response = requests.get(url=base_url, headers=headers, params=params)
    html_str = response.content
    jsonobj = json.loads(html_str)

    # 每页20条链接数据进入列表
    for i in range(20):
        small_url_list = jsonpath.jsonpath(jsonobj, "$.results[{}].urls.small".format(i))[0].encode('utf-8')
        url_list.append(small_url_list)

# 列表去重
url_list = list(set(url_list))

# 写到文件中
for i in url_list:
    res = requests.get(url=i, headers=headers, stream=True)
    with open('./img/flower_'+str(j)+'.jpg', 'wb') as f:
        for data in res.iter_content(128):
            f.write(data)
        j += 1