一 Beautiful Soup的介绍
官网介绍:Beautiful Soup是一个可以从HTML或者XML文件中提取数据的Python库,能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式,Beautiful Soup 会帮你节省数小时甚至数天的工作时间。
简而言之:就是一种强大的解析工具,帮助我们从网页中提取数据时提高效率。
【tips】: BeautifulSoup自动将输入文档转换为Unicode编码, 输出文档转换为utf-8编码。
二 安装
推荐使用pip来安装:
pip install beautifulsoup4
验证是否安装成功(在解释器导入模块不报错即安装成功):
【tips】: 这里虽然安装的是beautifulsoup4这个包,但是在引用的时候是引入bs4,因为这个包源代码本身的库文件夹名称就是 bs4 。
三 Beautiful Soup 的解析器比较

本文介绍了Python库BeautifulSoup的基本概念、安装方法、解析器选择、使用技巧,包括标签选择器、CSS选择器、获取属性和文本等操作。重点讲述了find_all()、find()和select()等查询方法,强调了其在网页数据提取中的高效性。
最低0.47元/天 解锁文章
3963

被折叠的 条评论
为什么被折叠?



