douban下载图片

这段代码用于从豆瓣电影页面抓取指定类型的图片,并将其保存到本地的"picters"文件夹中。它首先获取电影照片页面,然后解析HTML,提取图片URL,逐张下载并保存。程序还能够自动遍历所有分页,抓取所有图片。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在douban上指定图片的网址.

 

import requests
from lxml import etree
url="https://movie.douban.com/subject/34867871/photos?type=W"
headers={"User-Agent":"mozilla/4.0 (compatible; MSIE 5.5; Windows NT)"}
page=requests.get(url=url,headers=headers).text
tree=etree.HTML(page)
num=tree.xpath('//div[@class="article"]//li')
a=1
for i in num:
    name="picters/"+f"{a}"+".jpg"
    path=i.xpath('.//img/@src')[0]
    data=requests.get(url=path,headers=headers).content
    f=open(name,"wb")
    f.write(data)
    f.close()
    a+=1
    print(name,"yes!!!")
url=tree.xpath('//span[@class="next"]/a/@href')
while url:
    url=url[0]
    page = requests.get(url=url, headers=headers).text
    tree = etree.HTML(page)
    num = tree.xpath('//div[@class="article"]//li')
    for i in num:
        name = "picters/" + f"{a}" + ".jpg"
        path = i.xpath('.//img/@src')[0]
        data = requests.get(url=path, headers=headers).content
        f = open(name, "wb")
        f.write(data)
        f.close()
        a += 1
        print(name, "yes!!!")
    url = tree.xpath('//span[@class="next"]/a/@href')

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值