Python爬取百度图片—模板

本文介绍了一种使用Python和requests库从百度图片搜索结果中批量下载图片的方法。通过定义一个函数,可以指定关键词、开始和结束页数以及保存路径,实现自动化图片抓取。文章详细展示了如何构造请求参数,解析JSON响应并下载图片。

 需要第三方库requests支持

         通过pip安装

         cmd输入:pip install requests

 

通过关键字进行爬取

import json
import os
import requests
def downloadImage(keyword,begin,end,file):
    id=0;
    if not os.path.exists(file):  # 目录不存在时,创建目录
        os.makedirs(file)
    for i in range(begin*30,end*30,30):
        data   = ({
            'tn': 'resultjson_com',
            'ipn': 'rj',         
            'queryWord': keyword,
            'word': keyword,     
            'pn': i,
            'rn': 30    
         })
        url = 'https://image.baidu.com/search/acjson'
        req=requests.get(url,params=data).json().get("data");
        for it in req:
            if 'thumbURL' in it and len(it['thumbURL'])>0:
                 print('正在下载:%s' % it['thumbURL'])
                 img = requests.get(it['thumbURL'])
                 open(file + '%d.jpg' % id, 'wb').write(img.content)
                 id += 1
            else:
                 print('链接已失效')
if __name__ == '__main__':
    dataList = downloadImage('星空',0,100,'d:/myImage/')  # (关键字,起始页数,终止页数(30张/页),存储目录)

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值