python bs4 入门

最新推荐文章于 2024-12-24 12:06:44 发布

原创最新推荐文章于 2024-12-24 12:06:44 发布 · 288 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

python爬虫笔记专栏收录该内容

26 篇文章

订阅专栏

python bs4 BeautiSoup入门

在这里插入图片描述

结果：

在这里插入图片描述

prettify（）：

在这里插入图片描述

直接打印相关内容

在这里插入图片描述

有多个相同标签时

在这里插入图片描述

找到三个href

在这里插入图片描述

bs4 对象种类

在这里插入图片描述

bs4 tag标签

在这里插入图片描述

找标签属性——attrs

在这里插入图片描述

NavigableString可导航的字符串

在这里插入图片描述

soup对象

在这里插入图片描述

comment 注释

在这里插入图片描述

遍历文档树

在这里插入图片描述

contents chlidren descendents

在这里插入图片描述

string strings stripped strings–把多余空格去掉

string——获取标签里面的内容

在这里插入图片描述

strings——返回是一个生成器对象用过来获取多个标签内容

在这里插入图片描述

stripped_strings——和strings基本一致但是它可以把多余的空格去掉

在这里插入图片描述

遍历父节点

在这里插入图片描述

parent

在这里插入图片描述

html的父节点是整个soup对象

在这里插入图片描述

parents

在这里插入图片描述

遍历兄弟节点

在这里插入图片描述

next_sibling 下一个兄弟节点

在这里插入图片描述

previous_sibling 上一个兄弟节点

在这里插入图片描述

搜索数——findAll&find_all

在这里插入图片描述

find（）找一个

在这里插入图片描述

find_all（）找全部以列表形式返回

在这里插入图片描述

find_all只找某几条

在这里插入图片描述

1.class_

在这里插入图片描述

attrs{:}

在这里插入图片描述

多重约束条件

在这里插入图片描述

获取标签内部信息

在这里插入图片描述

过滤第一条——用切片[1:]

在这里插入图片描述

评论 3

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。