立即学习:https://edu.youkuaiyun.com/course/play/24756/280698?utm_source=blogtoedu
(1)获取标签内容(第一个符合要求的标签):
from bs4 import BeautifulSoup
html=""" """
# 创建 Beautiful Soup 对象
# 使用lxml来进行解析
soup = BeautifulSoup(html,"lxml")
print(soup.p['class'])
or print(soup.p.get('class))
修改属性值:soup.p['class']='name'
(2)NavigableString:
print(soup.p.string)
(3)文档注释部分:comment:
html注释内容:<b><!-- --></b>
print(soup.b.string)(只能打印查找的第1个)