python获取豆瓣评分9分以上的电影

最新推荐文章于 2025-12-11 20:49:41 发布

原创最新推荐文章于 2025-12-11 20:49:41 发布 · 396 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #开发语言

部署运行你感兴趣的模型镜像

我想生成的文件用excel保存，所以得安装一下这个

pip install pandas openpyxl

代码

import requests
import pandas as pd

# 模拟浏览器请求头
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
}

# 豆瓣电影搜索评分9分以上的URL模板
base_url = 'https://movie.douban.com/j/new_search_subjects?sort=U&range=9,10&tags=&start='

# 存储电影信息的列表
movies_info = []

# 爬取前10页的数据（每页20部电影）
for start in range(0, 200, 20):
    url = base_url + str(start)
    
    # 发送请求
    response = requests.get(url, headers=headers)
    response.raise_for_status()
    
    # 解析JSON响应
    data = response.json()
    
    # 查找电影条目
    for item in data['data']:
        title = item['title']
        rating = item['rate']
        link = item['url']
        
        movies_info.append({
            'title': title,
            'rating': rating,
            'link': link
        })

# 将数据转换为DataFrame
df = pd.DataFrame(movies_info, columns=['title', 'rating', 'link'])

# 保存为Excel文件
excel_file = "douban.xlsx"
df.to_excel(excel_file, index=False)

print(f"数据已成功写入 {excel_file}")

共有200个电影9分以上

您可能感兴趣的与本文相关的镜像

Python3.8

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

irisMoon06

关注关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

使用Python 爬虫获取豆瓣网高分电影评分大于等于9.0的部电影，包括评分、评价人数、导演、上映时间这些信息

weixin_44328257的博客

06-21

589

要获取豆瓣网高分电影，评分大于等于9.0的电影信息，包括评分、评价人数、导演、上映时间等信息，可以使用Python爬虫和BeautifulSoup库来实现。

爬取豆瓣评分前50的电影信息

weixin_42213622的博客

04-30

2246

文章目录项目描述内容模块代码区项目描述根据豆瓣评分排名，获取豆瓣评分前50的电影信息。主要包括：电影名称、电影评分、评价人数和电影短评信息，并存储到本地表格文件。内容模块使用requests获取页面信息。使用BeautifulSoup结合正则表达式解析页面，获取所需要的电影名称、电影评分、评价人数、电影短评等信息。然后使用openpyxl模块将信息保存到新建的excel表格中。代码区 i...

参与评论您还未登录，请先登录后发表或查看评论

Python爬虫项目：豆瓣评分筛选高分电影

weixin_31961675的博客

10-21

1192

本文还有配套的精品资源，点击获取简介：本项目采用Python编写了一个自动化爬虫脚本，用于抓取豆瓣电影评分，并筛选出评分高于7分的新上传电影，以便用户下载观看。通过爬虫工具如requests和BeautifulSoup等，项目能够提取电影相关信息，并利用Pandas进行数据处理和分析。此项目不仅涉及网络爬虫技术，还涵盖了数据处理、分析和结果展示等多个方面，展示了Pytho...

豆瓣安装

huanglianggu的专栏

07-28

499

pip3 install -i http://pypi.douban.com/simple --trusted-host pypi.douban.com PyMySQL

Python爬虫豆瓣读书评分9分以上榜单

热门推荐

ZhangRui的博客

03-18

2万+

有了上次的经验，这次爬豆瓣读书评分9分以上榜单，链接豆瓣读书评分9分以上榜单。打开链接，查看网页源代码，查找我们需要的信息的字段标签，本次以书名、评分、评价人数、图片、出版社、出版日期、ISBN编号为目标，分别进行处理、获取并保存。（当然最根本的前提依然是通过url获取到网页的源代码）本实例完整代码请移步github： https://github.com/selfcon/douba

python获取豆瓣电影

weixin_45436844的博客

11-27

954

打开豆瓣，点击选电影到这里你会发现很简单，直接用xpath不久很容易获取到电影名及评分了吗。其实我们看到的页面是经js渲染过的，真正数据的网页在⬇ 当你点击加载更多时，会发现这个网址的前部分不变，0变成20。我们先来获取热门这一类。用requests获取到的是json格式的数据，也就是python中的字典。获取‘subjects’对应的值，是一个包含电影信息的列表。遍历列表，即可获取...

电影评分不求人：Python爬虫让你成为豆瓣达人

Vergelight的博客

12-29

649

在这个光影交错的世界里，电影成了我们生活的一部分。豆瓣电影，作为国内最具影响力的电影评分平台，聚集了无数影迷的真实声音。作为一名电影发烧友兼技术爱好者，我决定用Python爬虫技术，为大家挖掘豆瓣电影的评分数据。以下是我如何通过Python爬虫获取豆瓣电影评分的全过程，咱们一起来看看。

使用Python爬虫获取豆瓣电影排行（进阶）

qq_70327740的博客

03-27

1905

对于上一个使用爬虫获取豆瓣电影信息的博客进行改进。将所有代码放在了文章最后，需要的自行提取。

python爬虫获取豆瓣TOP25电影名称和评分

qq_45623158的博客

11-26

1588

import requests import lxml.html myheaders = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36"} # 获取豆瓣电影Top250的网页， # 并转换了可使用XPath分析的对象 http_response = requests.get('https:/

精选资源

Python爬虫程序源代码爬取豆瓣TOP250排行榜数据电影名称评分导演演员等信息

12-21

Python爬虫程序源代码爬取豆瓣TOP250排行榜数据电影名称评分导演演员等信息知识领域：数据爬取、数据分析、Python编程技术关键词： Python、网络爬虫、数据抓取、数据处理内容关键词：豆瓣电影、排行榜、数据...

基于python获取豆瓣电影TOP和电影实时票房项目源码

01-12

项目的核心功能主要分为两部分：一部分是获取豆瓣电影TOP排行榜数据，另一部分是获取实时票房数据。对于豆瓣电影TOP排行榜，程序首先需要访问豆瓣电影的官方页面，通过分析页面结构来定位电影排行榜的URL地址，然后...

python豆瓣电影爬虫

04-15

本项目旨在利用Python构建一个爬虫，爬取豆瓣电影Top250的电影信息，包括电影名称、评分、简介、导演、主演等，然后对数据进行处理，实现数据保存、可视化展示和词频统计。首先，我们需要使用到Python的requests库...

基于Python爬虫技术自动抓取睿思平台每周新上传电影信息并同步获取对应豆瓣评分数据_睿思电影资源_豆瓣评分爬取_高分电影筛选统计_自动化电影推荐系统_用于筛选8分以上优质电影资源.zip

09-04

本文档内容涉及的是一个基于Python编程语言开发的爬虫系统，该系统具有自动抓取网络平台上新上传电影信息的功能，并且能够同步获取到这些电影在豆瓣网站上的评分数据。系统的核心目的是筛选出评分在8分以上的高评分...

javascript 性能优化实战：异步和延迟加载

小伙伴们全都Lucky！

12-11

462

本文探讨JavaScript性能优化中的异步加载与延迟加载技术。异步加载通过async/defer属性或动态创建script元素避免阻塞渲染；延迟加载则利用IntersectionObserver API按需加载非关键资源。二者结合可显著提升性能：异步加载核心脚本确保交互流畅，延迟加载减少初始请求量。实践表明，该方案能降低DOMContentLoaded时间30%以上，减少初始加载量90%，但需注意async脚本的执行顺序问题和延迟加载的回退处理。文中提供了完整的代码实现示例。

Python 海象运算符

这是一个c++热爱者的博客哟

12-08

642

Python 3.8引入的海象运算符(:=)允许在表达式中进行变量赋值，能有效减少重复代码。它特别适用于循环条件、列表推导式等场景，如while (line := file.readline()):可简化文件读取操作。使用时需注意：必须加括号，避免在复杂表达式中过度使用以免降低可读性。虽然该特性能精简代码，但应遵循团队约定，在保持代码清晰的前提下合理使用。

27、Python压缩备份安全指南：从zipfile到AES-256加密，生产级自动化备份全方案

12-11

673

本文介绍了Python自动化压缩备份的全套解决方案，从基础到高级应用，涵盖以下核心内容：需求分析：针对个人开发、企业数据、服务器备份等场景，对比传统手动备份与Python自动化方案的优劣技术选型：详细对比zipfile、pyzipper和7z命令行等方案，提供决策树指导选择最优方案基础实现：使用zipfile标准库实现单个文件和目录的压缩通过生成器模式优化大目录遍历，降低内存占用保留完整目录结构的递归压缩方法安全进阶：重点推荐AES-256加密方案（pyzipper或7z）强调避免使用存在

第30篇：逆袭量化路：用 bot_start 和 bot_loop_start 玩转 Freqtrade 策略

qq_36936892的博客

12-06

312

Freqtrade策略开发中，bot_start()和bot_loop_start()是两个关键生命周期函数。bot_start()在机器人启动时仅调用一次，适合初始化数据、加载资源等操作；bot_loop_start()在每个交易循环开始时触发，可用于状态刷新、动态参数调整等周期性任务。开发者应注意前者只需快速执行，后者需保持轻量以避免阻塞。合理使用这两个函数能增强策略灵活性，支持复杂交易逻辑实现。掌握这两个回调函数是提升Freqtrade策略开发效率的重要环节。

Python 语言编码规范

托塔天王的博客

12-11

612

通常，不应该描述”怎么做”，除非是一些复杂的算法，文档字符串应该提供足够的信息，当别人编写代码调用该函数时，他不需要看一行代码，只要看文档字符串就可以了，对于复杂的代码，在代码旁边加注释会比使用文档字符串更有意义。但是，不要使用一个以上的空格，并且在二元运算符的两边使用相同数量的空格。当捕获异常时，使用as而不要用逗号。3、关于函数的几个方面应该在特定的小节中进行描述记录，这几个方面如下文所述，每节应该以一个标题行开始，标题行以冒号结尾，除标题行外，节的其他内容应被缩进2个空格。

Cisco 200-901 DEVASC 認證考試

2503_94018152的博客

12-08

860

Cisco 200-901 DEVASC考试是Cisco DevNet Associate认证的核心科目，聚焦网络自动化、API开发及Cisco平台集成。考试涵盖软件开发、API应用、网络基础等6大领域，费用300美元，时长120分钟。该认证适合希望掌握网络自动化技能的IT人员，需具备Python基础，但无需实体设备。作为DevNet认证体系的入门级考试，200-901为工程师开启通往高级自动化认证的大门，符合当前IT行业向自动化转型的趋势。

python爬虫获取豆瓣评分

02-08

### 使用Python编写爬虫程序抓取豆瓣电影评分为了实现这一目标，可以采用`requests`库发送HTTP请求以及`BeautifulSoup`解析HTML文档。以下是具体方法： #### 准备工作确保已安装必要的Python包，可通过pip命令安装这些依赖项： ```bash pip install requests beautifulsoup4 lxml openpyxl ``` #### 抓取页面内容利用`requests.get()`函数向目标URL发起GET请求，并获取响应体中的HTML源码。 ```python import requests from bs4 import BeautifulSoup url = 'https://movie.douban.com/top250' headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64)" } response = requests.get(url, headers=headers) html_content = response.text ``` #### 解析网页结构创建`BeautifulSoup`对象来解析下载下来的HTML字符串，提取所需的数据字段如电影名称、评分等。 ```python soup = BeautifulSoup(html_content, 'lxml') movies = [] for item in soup.find_all('div', class_='item'): title = item.select_one('.title').get_text(strip=True).split()[0] rating_num = float(item.select_one('.rating_num').get_text()) movies.append({"Title": title, "Rating": rating_num}) ``` #### 存储数据至CSV文件借助内置模块csv将收集好的列表写入本地磁盘作为持久化存储[^3]。 ```python import csv with open('douban_top_250.csv', mode='w', newline='', encoding='utf-8') as f: writer = csv.DictWriter(f, fieldnames=["Title", "Rating"]) writer.writeheader() writer.writerows(movies) ``` 上述代码片段展示了如何通过Python脚本自动化地从豆瓣网获取热门影片及其对应的观众评价分数，并最终导出为易于阅读的表格形式以便后续分析处理。