ImageNet爬取数据集

一个追逐自我的程序员

于 2018-06-30 17:42:44 发布

阅读量1.9k

点赞数

本文链接：https://blog.youkuaiyun.com/qq_34739497/article/details/80868535

版权

这里写图片描述
直接下载不了，需要是教育机构邮箱，由于我没有，所以只能通过它给的链接爬取

import requests
import urllib.request
import time#导入包
import os

file=open("C:\\Users\\user\\Desktop\\image.txt",encoding="utf-8")
for i,line in enumerate(file):
    try:
        print(i)
        if i<472:
            continue
        if os.path.exists("./data1/{}.jpg".format(i)):
            print("file exist")
            continue
        web = urllib.request.urlopen(line)
        time.sleep(0.5)#设置时间间隔为3秒
        data = web.read()
        f = open("./data1/{}.jpg".format(i),"wb")
        f.write(data)
        f.close()
    except:
        continue