直接上代码
__author__ = 'Elvis'
#-*- coding: UTF-8 -*-
import urllib
import re
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
def getImage(html):
imgre = re.compile(r'src="(.+?\.jpg)"')
imglist = imgre.findall(html)
x=0
for image in imglist:
urllib.urlretrieve(image,'%s.jpg' % x)
x+=1
html = getHtml("http://tieba.baidu.com/index.html")
print getImage(html)
页面代码
结果:
本文介绍了一个简单的Python脚本,用于从百度贴吧抓取图片。通过使用urllib和正则表达式re模块,该脚本能够解析网页源代码并下载图片到本地。
1070

被折叠的 条评论
为什么被折叠?



