github地址:
https://github.com/ZhengLin-Li/leaning-spider-COVID19Situation
1. BeautifulSoup的find方法
# for example
soup.find('a') # 根据标签名查找
soup.find(id='link1') # 根据属性查找
soup.find(attrs={
'id':'link1'}) # 根据属性查找
soup.find(test='aaa') # 根据标签文本内容查找
2. Tag对象
find方法返回的是Tag对象,有如下属性
Tag对象对应于原始文档中的html标签
name:标签名称
attrs:标签属性的键和值
text:标签的字符串文本
3. 正则表达式
. \d
+*?
()
[]
\
r原串
import re
rs = re.findall('\d','123')
rs = re