目录
bs4简介:
bs4全称BeautifulSoup4,是爬虫的必学技能。
BeautifulSoup4也是一个HTML / XML的解析器,主要功能也是如何解析和提取HTML / XML数据。
在此,我们学习最基本,最简单容易上手的使用bs4爬取数据。
Step 1:下载bs4
常见的方式是在windows系统上win+R调出运行,输入cmd进入控制台。
输入指令pip list可以看见目前已经安装的包

下载bs4包指令为:pip install bs4
由于下载包默认引用的地址是国外的网站,因此可能出现界面卡住,进度条过慢的情况,
一般我们手动通过引用国内镜像源,例如:
1、清华 https://mirrors.tuna.tsinghua.edu.cn/
2、中科大USTC镜像源 https://mirrors.ustc.edu.cn/ <

本文介绍了Python爬虫必备库BeautifulSoup4的基础用法,包括下载安装和基本使用。通过实例展示了如何筛选HTML元素,如查找特定类名或ID的div和span标签。
最低0.47元/天 解锁文章
801

被折叠的 条评论
为什么被折叠?



