python爬千图网高清图片

在尝试使用Python爬取千图网高清图片时遇到了HTTP 403错误、Unicode编码问题和图片无法打开的问题。解决方法包括伪装浏览器(设置"User-Agent"和"Referer"头部),修正复制的"User-Agent"字符串,以及在保存图片时使用二进制模式"wb"代替文本模式"w"。经过调整,成功克服了爬虫难题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

代码如下:

import urllib.request
import re
for i in range(1,2):
        url = "http://www.58pic.com/piccate/7-128-0-default-0_2_0_0_default_0-" + str(i) + ".html"
        data = urllib.request.urlopen(url).read().decode("utf-8","ignore")
        pat = '<a class="card-img video-play" target="_blank" href="(.*?)">'
        imgUrlList = re.compile(pat).findall(data)
        for j in range(0,len(imgUrlList)):
                imgPageData = urllib.request.urlopen(imgUrlList[j]).read().decode("utf-8","ignore")
                pat = 'src="(.*?)" class="show-area-pic"'
                imgUrl = re.search(pat,imgPageData).group(1)
                headers = { "Accept":"text/html,application/xhtml+xml,application/xml;",
                "Accept-Encoding
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值