【实践】Python爬取豆瓣电影排行榜页面数据

最新推荐文章于 2025-06-23 10:16:45 发布

春光先生

最新推荐文章于 2025-06-23 10:16:45 发布

阅读量1.1k

点赞数 41

CC 4.0 BY-SA版权

分类专栏： Python程序设计文章标签： python 开发语言

原创文章，转载请注明出处。

在本节中，我们将使用 requests 库爬取 豆瓣电影排行榜页面数据。通过一步步实操，学习如何使用 requests 库发送 HTTP 请求、获取网页 HTML 数据，并为后续的网页解析做好准备。

豆瓣电影提供了电影排行榜页面，网址如下：

https://movie.douban.com/top250

在本节中，我们的目标是：

在爬取网页之前，需要安装 requests 库：

pip install requests

requests 是 Python 的 HTTP 库，用于发送网页请求、获取网页数据。

我们首先尝试访问豆瓣电影排行榜页面，并获取返回的 HTML 数据。

import requests

# 目标网址
url = "https://movie.douban.com/top250"

# 发送 GET 请求
response = requests.get(url)

# 输出网页 HTML 内容
print(response.text)

程序执行后，终端会打印出HTML 代码，其中包含电影排行榜页面的所有信息。

直接使用 requests.get(url) 可能会遇到 403 Forbidden 错误，原因是：

200万优质内容无限畅学