python 网页爬虫，下载网络图片

最新推荐文章于 2024-06-10 23:29:37 发布

原创最新推荐文章于 2024-06-10 23:29:37 发布 · 393 阅读

0 ·

CC 4.0 BY-SA版权

python爬虫专栏收录该内容

4 篇文章

订阅专栏

本文介绍了一种使用 Python 技术从本地 HTML 文件中提取图片链接并下载的方法。通过解析 HTML 文件，利用 BeautifulSoup 库找到所有图片元素，进而获取其原始链接进行下载。文中涉及的技术包括正则表达式、BeautifulSoup 和 requests 库。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

# coding=utf-8

import lxml,bs4,re,requests

csvContent=''

file = open('D:\\tyc_demo.html','rb')
soup = bs4.BeautifulSoup(file,'html.parser')

pics=soup.find_all(attrs={'class': 'origin_image zh-lightbox-thumb lazy'})

for pic in pics:
    link = str(pic)
    link = link[(link.index('data-original="')+15):link.index('" data-rawheight=')]
    print(link)
    print()
    
    resultPage = requests.get(link)
    
    with open(('E:\\pics\\'+link[26:]),'wb') as file:  
        file.write(resultPage.content) 




print(csvContent)