Python中安装Beautiful Soup库及其相关解析器的方法2-1

本文档介绍了如何在IDLE和PyCharm中安装并使用BeautifulSoup库以及其依赖的第三方解析器lxml和html5lib。首先,通过cmd命令行检查已安装的Python模块,发现BeautifulSoup未被安装。接着,使用pip命令分别安装BeautifulSoup、lxml和html5lib,并验证安装是否成功。在完成安装后,可以在IDLE中顺利导入并使用BeautifulSoup进行HTML和XML文档的数据提取。

Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库。它能够实现惯用的文档导航,查找,修改文档的方式。Beautiful Soup会帮你节省数小时甚至数天的工作时间。Beautiful Soup支持Python标准库中的HTML解析器,还支持一些第三方的解析器,这些第三方的解析器包括“lxml”和“html5lib”等。

在IDLE和PyCharm中使用Beautiful Soup时,需要安装相应的库及第三方解析器。

1 IDLE中使用BeautifulSoup库及其相关解析器

1.1 IDLE中的报错信息

在IDLE中使用如下代码导入BeautifulSoup时会报错,如图1所示。

图1 导入BeautifulSoup时的报错信息

以上报错信息是“没有找到相关模块错误信息:没有找到名为bs4的模块”。

1.2 在cmd中查看安装的模块

点击“Win”+“R”键,在弹出的“运行”界面中输入“cmd”,如图2所示。

图2 “运行”界面中输入“cmd”

点击“确定”后,进入cmd界面。在cmd中输入“pip list”并点击回车按键,查看当前安装的模块,如图3所示。

图3 查看当前安装的模块

从图3中可以看出,当前并没有安装BeautifulSoup模块。

1.3 通过cmd安装BeautifulSoup模块

在cmd中输入“pip install beautifulsoup4”,开始安装BeautifulSoup模块,如图4所示。

图4 安装BeautifulSoup模块

从图4中可以看出,BeautifulSoup模块安装成功。此时再次输入“pip list”查看安装的模块,如图5所示。

图5 查看安装的模块

从图5中可以看到,BeautifulSoup模块已经安装成功。在IDLE中再次导入BeautifulSoup模块,此时代码能够成功运行,如图6所示。

图6 代码能够成功运行

1.4 通过cmd安装lxml解析器

在cmd中输入“pip install lxml”,开始安装lxml解析器,如图6所示。

图7 安装lxml解析器

1.5 通过cmd安装html5lib解析器

在cmd中输入“pip install html5lib”,开始安装html5lib解析器,如图8所示。

图8 安装html5lib解析器

在cmd中输入“pip list”,可以看到,lxml解析器和html5lib解析器已经安装成功,如图9所示。

图9 lxml和html5lib安装成功

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值