Python爬取百度图片—模板

最新推荐文章于 2024-04-26 01:48:58 发布

原创最新推荐文章于 2024-04-26 01:48:58 发布 · 412 阅读

0 ·

CC 4.0 BY-SA版权

Python 专栏收录该内容

5 篇文章

订阅专栏

本文介绍了一种使用Python和requests库从百度图片搜索结果中批量下载图片的方法。通过定义一个函数，可以指定关键词、开始和结束页数以及保存路径，实现自动化图片抓取。文章详细展示了如何构造请求参数，解析JSON响应并下载图片。

需要第三方库requests支持

通过pip安装

cmd输入：pip install requests

通过关键字进行爬取

import json
import os
import requests
def downloadImage(keyword,begin,end,file):
    id=0;
    if not os.path.exists(file):  # 目录不存在时，创建目录
        os.makedirs(file)
    for i in range(begin*30,end*30,30):
        data   = ({
            'tn': 'resultjson_com',
            'ipn': 'rj',         
            'queryWord': keyword,
            'word': keyword,     
            'pn': i,
            'rn': 30    
         })
        url = 'https://image.baidu.com/search/acjson'
        req=requests.get(url,params=data).json().get("data");
        for it in req:
            if 'thumbURL' in it and len(it['thumbURL'])>0:
                 print('正在下载：%s' % it['thumbURL'])
                 img = requests.get(it['thumbURL'])
                 open(file + '%d.jpg' % id, 'wb').write(img.content)
                 id += 1
            else:
                 print('链接已失效')
if __name__ == '__main__':
    dataList = downloadImage('星空',0,100,'d:/myImage/')  # （关键字,起始页数，终止页数(30张/页)，存储目录）