去除指定标签
from bs4 import BeautifulSoup
#去除属性ul
[s.extract() for s in soup("ul")]
# 去除属性svg
[s.extract() for s in soup("svg")]
# 去除属性script
[s.extract() for s in soup("script")]
去除注释
from bs4 import BeautifulSoup, Comment
#去除注释
comments = soup.findAll(text=lambda text: isinstance(text, Comment))
[comment.extract() for comment in comments]
本文介绍如何使用BeautifulSoup库去除HTML中的特定标签(如ul、svg、script)及注释,通过代码示例展示具体操作过程。
2659

被折叠的 条评论
为什么被折叠?



