import urllib
import urllib2
import os
import re
f=open("E:\\data\\faceScrub\\facescrub_actresses.txt")
i=f.read()
save_path="E:\\data\\faceScrub\\"
list1=i.split()
pat = re.compile('http://(.)+')
idx=1
for s in list1:
m = re.search('http', s, re.IGNORECASE)
if bool(m):
print s
fileName=save_path+str(idx)+".jpg"
try:
urllib.urlretrieve(s,fileName)
idx=idx+1
except Exception,e:
print e此版本比较粗糙,面对需要输入用户名和密码的网址就无法继续了。

本文介绍如何利用Python的urllib和正则表达式模块从文本中抓取并下载图片链接到指定文件夹。
2866

被折叠的 条评论
为什么被折叠?



