BeautifulSoup复习练习爬取图片错误及改正

本文介绍了在使用BeautifulSoup爬取网页图片时遇到的错误,包括尝试获取alt属性时遇到的None值问题,以及在保存图片过程中出现的Unicode编码错误。通过使用get方法避免了None值错误,而在保存图片时正确处理了Unicode文件名,最终成功爬取并下载了图片。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

需求:

根据目标网站“http://www.youzi4.cc/”为基础,抓取首页页面的图片并下载到本地,并命名为图片标签中alt="命名内容"

环境:win7 、pycharm、python2

所用到的库:urllib 、 BeautifulSoup、requests、

其中遇到的错误:

 

#<img alt="大腿上的玫瑰蛇纹身图案_大腿纹身图案" height="140" src="http://res.youzi

在抓取img标签中alt属性的时候利用ul["alt"]出现以下错误

 

Traceback (most recent call last):
File "E:/PycharmProject/��ϰ/2Beautifulʵս.py", line 38, in <module>
    for i in getlist():
File "E:/PycharmProject/��ϰ/2Beautifulʵս.py", line 20, in getlist
    alt=uls["alt"]
File "E:\Python27\lib\site-packages\bs4\element.py", line 1011, in __getitem__
    return self.attrs[key]
  KeyError: 'alt'

然后将uls的内容依次打印一下发现竟然有一个没有alt属性,如下图所示:

 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值