python/爬虫/BeautifulSoup的安装与requests使用

BeautifulSoup 是一个用于解析 HTML 和 XML 文档的 Python 库。它常与 requests 库一起使用,用于从网页中提取数据。

1.安装

使用 pip 进行安装:

pip install beautifulsoup4

基本用法

1.导入库

需要导入 BeautifulSoup 类和 Request 方法(如果你打算从网络上获取 HTML)。

from bs4 import BeautifulSoup
import requests

 2.获取网页内容

使用 requests.get 方法获取你想要解析的网页的内容。

response = requests.get('https://www.baidu.com/')
html_content = response.text

 3.创建 BeautifulSoup 对象

soup = BeautifulSoup(html_content, 'lxml')

4.搜索元素

使用 BeautifulSoup 对象的方法来搜索 HTML 中的元素。 

elements = soup.find_all('tag_name')

 使用 CSS 类名查找

elements = soup.find_all(class_='class_name')

 使用其他属性查找

elements = soup.find_all(attrs={'attribute_name': 'attribute_value'})

5.提取数据: 从找到的元素中提取数据。

提取文本

text = element.get_text()

提取标签: 

tag = element.name

提取属性

attribute_value = element['attribute_name']

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值