通过 CSS 也是可以定位元素
的位置。在写 CSS 时,标签名不加任何修饰,类名前加点 . ,id 名前加 #,在这里我们也可以利用类似的方法来筛选元素,用到的方法是 soup.select(),返回类型是 list。
select的语法
"."表示class属性
“#”表示id属性
- 通过css的class类查找
print soup.select(".sister")
print soup.select("[class~=sister]") - 通过tag的id属性查找
print soup.select("#link1")
print soup.select(“a#link2”) - 通过属性值来查找
print soup.select(‘a[href=“http://example.com/elsie”]’)
print soup.select(‘a[href^=“http://example.com/”]’)
print soup.select(‘a[href$=“tillie”]’)
print soup.select(‘a[href*=".com/el"]’) - 查找p节点下下ID属性的标签
print soup.select(“p > #link1”)
2572

被折叠的 条评论
为什么被折叠?



