BeautifulSoup的find_all()函数的attributes参数的小发现

我在学习《Python网络爬虫权威指南》的时候,学习到关于介绍find_all()函数的参数的内容,里面介绍到属性参数attributes时介绍了其中一种用法:

.find_all('span', {'class':{'green', 'red'}})

这个函数会返回HTML文档里面红色和绿色两种颜色的span标签。
我就想试试不用大括号是否有同样的结果:
修改后的代码:

from urllib.request import urlopen
from bs4 import BeautifulSoup

html = urlopen('http://www.pythonscraping.com/pages/warandpeace.html')
bs = BeautifulSoup(html.read(), 'html.parser')

nameList = bs.find_all('span', {'class':'green', 'class':'red'})
for name in nameList:
    print(name.get_text())

然后我把原本代码爬出来的文本和改过的代码爬出来的文本以及单独用’class’:‘green’和单独用’class’:‘red’爬出来的文本进行比较,发现’class’:{‘green’, ‘red’}会同时把文档中红色和绿色两种颜色的span标签爬出来,而我修改以后的代码爬出的文本和单独用’class’:'red’爬出来的一样,所以我猜测按我这样不加大括号的写法,会让程序把最后一个class的条件作为属性。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值