- 北京
- 上海
- 重庆
- 天津
welcome
hello world
- 查找第一个符合条件的值:
print(soup.a)
- 查找标签的属性和属性值并以列表的形式展现
print(soup.a.attrs)
===============================================================================
- 返回第一个符合条件的结果
print(soup.find(‘a’))
- 根据title的值来查找对应的标签对象
print(soup.find(‘a’,title=“t2”))
- 根据class的值来查找对应的标签对象
注:class在这里需要添加下划线来表示本身而不是关键字。
print(soup.find(‘a’,class_=“a1”))
- 返回所有符合条件的标签,并以列表的形式显示
print(soup.find_all(‘a’))
- 返会多个标签,因为返回的结果为列表,因此在打印多个标签结果时,需要加上[]
print(soup.find_all([‘a’,‘p’]))
- 返回前两个符合条件的标签
print(soup.find_all(‘li’,limit=2))
- 返回所有符合条件的结果
print(soup.select(‘a’))
- 通过类选择器.表示class。
print(soup.select(‘.a1’))
- 通过类选择器#来表示id
print(soup.select(‘#i1’))
- 通过属性选择器来查找li中带有id的结果
print(soup.select(‘li[id]’))
- 通过属性选择器查找li中class为cl3 的结果
print(soup.select(‘li[class= “cl3”]’))
- 通过后代选择器(空格),打印div所有后代为li的值
print(soup.select(‘div li’))
- 子代选择器 > 打印某一级的子标签
print(soup.select(‘div > ul > li’))
- 打印多个标签结果 ,在select属性中不需要加[],输出的结果以列表的形式显示
print(soup.select(‘a,p’))
============================================================================
获取节点内容
obj.string
obj.get_text()
实例:
html代码
obj = soup.select(‘#i2’)[0]
print(obj.string)
print(obj.get_text())
运行结果:
注:如果标签对象中只有内容,那么string和get_text()都可以使用。如果标签对象中,除了内容还有标签,那么string获取不到数据,只有get_text()可以获取到数据。一般情况下,我们用get_text()居多。
============================================================================
obj.name获取标签名字
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注:Python)
6St1C-1713676932265)]
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注:Python)
python爬虫从0到1 -beautifulsoup(bs4)的基本使用(1)
最新推荐文章于 2025-04-11 22:46:48 发布