一、find与findAll函数
find或findAll函数用于定位所需的html内容,定义如下:
findAll(tag,attributes,recursive,text,limit,keywords)
find(tag,attributes,recursive,text,keywords)
其中findAll返回一组结果,而find只返回第一个结果
①主要是使用前两个参数,使用时形如:
#查找clss为green或red的span标签及其内容
nameList=bsObj.findAll("span",{
"class"{
"green","red"})
for name in nameList: #循环输出名字
print(

本文详细介绍了Python的BeautifulSoup库在网络爬虫中的应用,包括find与findAll函数的使用,如查找特定内容、限制返回结果数量、递归搜索及过滤条件。此外,还探讨了导航树的概念,包括子标签、后代标签、兄弟标签和父标签的操作,以及如何获取标签的属性。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



