BeautifulSoup库的名字来源于路易斯.卡罗尔在《爱丽丝梦游仙境》里的同名诗歌,BeautifulSoup化平淡为神奇,它通过定位HTML标签来格式化和组织复杂的网络信息,用简单易用的Python对象为我们展现结构信息。
在我们安装完Anaconda之后就自带BS4了
首先,我们利用BeautifulSoup来得到百度的标题:
from urllib.request import urlopen
from bs4 import BeautifulSoup
html = urlopen("http://www.baidu.com")
Bs_html = BeautifulSoup(html)
print(Bs_html.title)输出结果为:
本文介绍了如何使用BeautifulSoup库解析HTML文档,通过简单的示例展示了如何从百度网站抓取页面标题,进而说明BeautifulSoup的强大功能。
551

被折叠的 条评论
为什么被折叠?



