【python】爬虫爬去已知图片url的图片

本代码示例展示了如何使用Python批量从CSV文件中读取图片URL,并将其下载到预定义的文件夹结构中。代码实现了根据图片类别创建子文件夹,并为每个类别的图片分配唯一的文件名。
import urllib.request
import numpy as np
import os
from tqdm import tqdm
import urllib

boot_path = 'F:/Ubuntu16.4共享文件夹/数据集/Googleland/'
img_url_f = open('F:/Ubuntu16.4共享文件夹/数据集/train.csv','r')
img_url_list = img_url_f.readlines()


num_now_class = np.zeros(1000).astype('int16')
for j in tqdm(range(1000),desc='目录创建已经完成'):
      os.mkdir(boot_path+str(j))



for i in tqdm(img_url_list[1:],desc='图片正在下载'):
    img_url_class = i.split(',')
    try:
        img_url = img_url_class[1][1:-1]
        img_class = img_url_class[2][:-1]
        if int(img_class)<1000:
            save_path = boot_path+img_class+'/img_'+str(10000+num_now_class[int(img_class)])+'.jpg'
            num_now_class[int(img_class)] += 1
            f = urllib.request.urlopen(img_url)
            with open(save_path, "wb") as code:
                code.write(f.read())
            code.close()
    except :
        pass
    continue

img_url_f.close()

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

甄同学

感谢我的朋友

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值