在Python中,我们经常需要从网页中提取数据或解析HTML文档。BeautifulSoup是一个强大的Python库,它可以帮助我们轻松地加载和解析HTML报文,从而提取出我们需要的信息。本文将介绍如何使用BeautifulSoup库加载HTML报文,并提供相应的源代码示例。
首先,我们需要安装BeautifulSoup库。可以使用pip命令在命令行中执行以下命令来安装:
pip install beautifulsoup4
安装完成后,我们就可以开始使用BeautifulSoup库来加载HTML报文了。
首先,我们需要导入BeautifulSoup库和我们将要解析的HTML报文。可以使用以下代码导入:
from bs4 import BeautifulSoup
# HTML报文
html_doc = """
<html>
<head>
<title>示例网页</title>
</head>
<body>
<h1>欢迎使用BeautifulSoup</h1>
<p class="intro">Bea