python bs4 BeautiSoup入门


结果:

prettify():

直接打印相关内容

有多个相同标签时




找到三个href



bs4 对象种类

bs4 tag标签


找标签属性——attrs

NavigableString可导航的字符串

soup对象

comment 注释


遍历文档树

contents chlidren descendents




string strings stripped strings–把多余空格去掉
string——获取标签里面的内容

strings——返回是一个生成器对象用过来获取多个标签内容

stripped_strings——和strings基本一致 但是它可以把多余的空格去掉

遍历父节点

parent

html的父节点是整个soup对象

parents


遍历兄弟节点

next_sibling 下一个兄弟节点


previous_sibling 上一个兄弟节点

搜索数——findAll&find_all



find()找一个

find_all()找全部以列表形式返回


find_all只找某几条

1.class_


attrs{:}

多重约束条件

获取标签内部信息


过滤第一条——用切片[1:]

329

被折叠的 条评论
为什么被折叠?



