python爬取豆瓣电影top250并保存为xlsx_python抓取豆瓣电影Top250数据并写入Excel

最新推荐文章于 2025-09-30 23:26:02 发布

原创

最新推荐文章于 2025-09-30 23:26:02 发布 · 1.4k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#python爬取豆瓣电影top250并保存为xlsx

该博客介绍了如何使用Python抓取豆瓣电影Top250的数据，包括电影标题、评分、上映日期等信息，并将这些数据存储到MySQL数据库，最后将数据导出为Excel文件。

douban

python抓取豆瓣电影Top250数据并写入Excel

1.将目标网站上的页面抓取下来

2.将抓取下来的数据根据一定的规则进行提取

create table `tb_movie`(

id int(11) primary key auto_increment,

title varchar(255),

score varchar(255),

date varchar(255),

region varchar(255),

category varchar(255),

directorAndActor varchar(255),

quote varchar(255),

thumbnail varchar(255)

)ENGINE=InnoDB DEFAULT CHARSET=utf8;

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# @Author : nacker 648959@qq.com

# @Time : 2020/3/4 6:25 下午

# @Site :

# @File : douban.py

# @Software: PyCharm

# 1.将目标网站上的页面抓取下来

# 2.将抓取下来的数据根据一定的规则进行提取

import time

import requests

import xlwt

from lxml import etree

from MysqlHelper import MysqlHelper

headers = {

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

密之山人

关注关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Python爬取豆瓣电影Top250数据

qq_41291067的博客

05-02

2069

爬取豆瓣电影top250中的影片名称、影片海报、年份、地区、类型、评分、评价人数、总体评价，并输出到douban_top250.xlsx文件中。

python爬取豆瓣电影top250编码_Python学习日记1| 用python爬取豆瓣电影top250

weixin_30888681的博客

12-28

929

今天是3.17号。离毕业论文开题只剩下不到15天，自己这边还不知道要写什么好，问了导师，导师给的范围超级广泛，实在是想吐槽。想了几天，决定了要尽快给老师说自己的想法和方向，做什么还是靠自己比较靠谱。身边的同学这学期都开始去实习了，自己投了很多份简历，大都石沉大海，唯一收到面试通知的广发基金，结果因为表现太差，缺乏深入思考gg了。看来术业有专攻，找到好工作还是要专的好。最近投了几篇小论文出去不过大都...

参与评论您还未登录，请先登录后发表或查看评论

豆瓣电影数据new.xlsx

05-20

豆瓣电影数据共3.8万条。包含[名字投票人数类型产地上映时间时长年代评分首映地点]

豆瓣电影数据集（截至2019.3）.xlsx

03-14

豆瓣电影数据集（截至2019年3月），共91369条。包含[电影名称，评分，评价人数，各星级占比，短评数量，影评数量，类型，导演，编剧，主演，制片国家/地区，语言，上映日期，片长，网址，剧情简介]

关于豆瓣的电影数据爬取与 Excel 交互式报表实现

最新发布

2503_92366040的博客

09-30

2055

本项目针对豆瓣电影官方 TOP250，通过 Python 完成数据爬取→清洗处理→Excel 交互式报表生成全流程，核心目标是精准提取豆列中 250 部电影的基础信息（名称、导演、主演等），并通过 Excel 实现可视化分析与数据筛选功能。

豆瓣电影数据集(2019.3).xlsx.zip

06-17

python爬取豆瓣电影top250数据存入excel

dltk9667的博客

08-14

1995

# -*- coding:utf-8 -*- """获取时光影评电影""" import requests from bs4 import BeautifulSoup from datetime import datetime,timedelta import pymysql #xlwt-1.3.0 #from xlwt.xlwt import * from xlwt...

豆瓣电影评分数据（3.8万条）.xlsx

07-25

豆瓣电影数据共3.8万条。包含[名字投票人数类型产地上映时间时长年代评分首映地点]

Python爬取豆瓣top250电影数据，并导入MySQL，写入excel

12-21

Python爬取豆瓣top250电影数据，并导入MySQL，写入excel 具体数据：电影链接、电影名称、电影评分、评分人数、电影概括 import pymysql import xlwt from bs4 import BeautifulSoup from urllib import request ...

爬取豆瓣电影Top250进行数据清洗并存储到MongoDB

weixin_45823871的博客

06-25

2306

pandas，requests，matplotlib，lxml，python爬虫，mongodb数据库，python数据分析，数据可视化，数据预处理

Python爬虫豆瓣电影Top250个电影数据保存在Excel

qq_53481873的博客

07-23

625

from bs4 import BeautifulSoup import urllib.request,urllib.error import re import xlwt #爬取网页 findLink = re.compile(r'<a href="(.*?)">') findImgSrc = re.compile(r'<img.*src="(.*?)"',re.S) findTitle = re.compile(r'<span class="title">(.*)&

30000豆瓣电影信息.xlsx

08-11

近30000条豆瓣电影信息，包括中文名，国别，类别，部分短评等信息。最关键的是有手工筛选过的关键词（类似于标签，但比标签更多）信息。

top250.xlsx

06-03

豆瓣电影数据集+数据分析入门数据集

06-26

【字段】电影名称、投票人数、类型、产地、上映时间、时长、年代、评分、首映地点【用途】该数据集非常适用了Python数据分析入门，是学习NumPy 、Pandas、Matplotlib的练手数据集

Python3爬虫豆瓣电影TOP250

02-02

利用Python3爬虫获得豆瓣影评TOP250，并将结果写入到EXCEL中

【python】爬虫实操完整案例 -- 豆瓣前250电影输出为 .xls文件

仿生实验室：从0到1，制作人脸表情交互机器人，记录过程，软硬件全部开源，与君共襄盛举！

05-08

389

完整实例—豆瓣250，输出为 .xls文件。

GO语言爬虫爬取豆瓣电影top250存入excel

weixin_30828379的博客

07-31

332

package mainimport ( "fmt" "github.com/tealeg/xlsx" "io/ioutil" "net/http" "regexp" "strconv" "time")//定义新的数据类型type Spider struct { url string header map[string]string}type F...

练习---将爬取的豆瓣TOP250存储到Excel表中

Croyance_M的博客

04-28

1796

爬取豆瓣TOP250的电影，存在Excel中 import requests from bs4 import BeautifulSoup import xlwt #------将爬取内容-豆瓣电影250-存储到excel表格中---------- def excel(movies,save_file): #存储成excel表 wb=xlwt.Workbook() #创建工作表 she...

python爬取豆瓣电影top250并保存为xlsx_Python爬取豆瓣电影TOP250并存入MySql数据库

weixin_39955355的博客

12-28

1173

Python爬虫实战：爬取豆瓣电影Top250并导出至Excel

本文将围绕标题“Python爬取豆瓣电影Top250[项目代码]”和描述内容，系统性地讲解其中涉及的核心知识点，并结合标签“Python爬虫数据处理 Excel操作”，展开详细的技术剖析。首先，该项目的基础是使用Python进行...