计算机毕业设计Django+Vue.js电影推荐系统 电影可视化 大数据毕业设计(源码+文档+PPT+讲解)

温馨提示:文末有 优快云 平台官方提供的学长联系方式的名片!

温馨提示:文末有 优快云 平台官方提供的学长联系方式的名片!

温馨提示:文末有 优快云 平台官方提供的学长联系方式的名片!

作者简介:Java领域优质创作者、优快云博客专家 、优快云内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、多年校企合作经验,被多个学校常年聘为校外企业导师,指导学生毕业设计并参与学生毕业答辩指导,有较为丰富的相关经验。期待与各位高校教师、企业讲师以及同行交流合作

主要内容:Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能与大数据、单片机开发、物联网设计与开发设计、简历模板、学习资料、面试题库、技术互助、就业指导等

业务范围:免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码编写、论文编写和辅导、论文降重、长期答辩答疑辅导、腾讯会议一对一专业讲解辅导答辩、模拟答辩演练、和理解代码逻辑思路等。

收藏点赞不迷路  关注作者有好处

                                         文末获取源码

感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助更多的人

介绍资料

  

摘  要 

ABSTRACT 

第1章 绪论 

1.1 研究背景 

1.2 研究意义 

1.3 研究目标 

第2章 相关技术介绍 

2.1 爬虫技术 

2.2 pandas技术 

2.3 Echarts技术 

2.4 MySQL介绍 

2.5 HTML介绍 

2.6 CSS介绍 

2.7 JavaScript介绍 

2.8 Xpath介绍 

2.9 Re介绍 

第3章 系统需求分析 

3.1 项目的必要性 

3.2 技术可行性 

3.3 时间可行性 

3.4 经济可行性 

第4章 豆瓣电影系统总体设计 

4.1 环境及库的准备 

4.2 数据库设计 

4.3 项目流程 

第5章 系统详细设计与实现 

5.1 数据爬取 

5.2 数据清洗、分析 

5.3 数据存储 

5.4 数据可视化 

5.5 项目首页实现 

5.6 项目可视化展示 

5.6.1电影种类饼图 

5.6.2电影评分折线图 

5.6.3历年产量折线图 

5.6.4电影数据时长分布占比 

5.6.5电影评分折线图 

5.6.6电影拍摄地点柱状图 

5.6.7电影类型饼图 

5.6.8导演作品数量柱状图 

5.6.9演员参演排名折线图 

5.6.10评论词云图 

第6章 结论 

6.1  设计总结 

6.2 问题与展望 

致  谢 

 摘  要

随着如今电影越来越多,各种各样的烂片和捞钱的商业片也层出不穷,而有意义的电影慢慢的变得很少。本项目是基于对豆瓣网的子网站豆瓣电影的网络爬虫技术到数据可视化分析的实现,从Pycharm的环境搭建到数据爬取,再数据处理,最后数据的可视化。该项目通过爬虫爬取目标网站,获取数据,在数据可视化的过程中,使用ECharts对做出的图表进行可视化处理,可以提高用户在需要时查找所需要信息的识别率,通过图表让人一目了然,比如一些多角度动态视图,解决了用户首次了解解决率如何,从而显著提高用户对电影的满意程度。

关键词:Python;数据分析;爬虫;可视化


ABSTRACT

As there are more and more movies nowadays, various types of bad movies and commercial films that seek to make money are also emerging in an endless stream, while meaningful movies gradually become rare. This project is based on the implementation of web crawler technology to data visualization analysis of Douban Movie, a sub website of Douban. com, from the construction of Pycharm's environment to data crawling, data processing, and finally data visualization. This project crawls the target website through a crawler to obtain data. During the data visualization process, ECharts is used to visualize the charts made, which can improve the recognition rate of users when they need to find the information they need. Through charts, for example, some multi-angle dynamic views, it solves the problem of users' first understanding of the resolution rate, thereby significantly improving users' satisfaction with the movie.

Key words: movie; Python; data analysis; crawler; visualization


第1章 绪论

1.1 研究背景

步入21世纪以来,随着全球互联网的飞速发展,中国紧跟潮流,正在空前地迈向一个信息时代。作为全球第二的经济强国,人口高达14亿,每天产生的数据是一个令人恐怖的数据值。据中国互联网络信息中心公布的《中国互联网络发展状况统计报告》显示,中国上网用户人数达五千八百万人,手机上网用户数规模已高达12.9亿户。人们的娱乐生活也越来越丰富。看电影,也逐渐成为人们工作之余放松、休闲的重要娱乐活动。不同的人喜欢不同的的电影类型、喜欢不同导演的作品,但是大部分的人喜欢什么题材类型的电影,对于电影行业今后的发展有着重要的参考意义。 随着生活水平的提高,所以现在看电影成为人们越来越普遍的娱乐活动,平时没事的时候,人们经常会约上三五知己去电影院里看上一场酣畅淋漓的电影缓解一下身体的压力。那么对于电影这个行业,大数据时代的来临,它会面临什么样的冲击呢?

1.2 研究意义

基于python豆瓣电影数据可视化分析,通过该系统的数据分析就能够是豆瓣电影平台实现内容个性化推荐精确的内容分发, 比如我们在音乐app 上看到的每日推荐, 网易云之所以推荐这么准, 就是他们在做点击率预估模型(预测给你推荐的歌曲你会不会点击)的时候, 考虑了你的用户可视化画像属性。

1.3 研究目标

本课题的实现,需要利用python网络爬虫技术,需要python及其第三方库和其他工具,按照数据采集、数据预处理、数据分析、数据可视化流程来进行实现,让学生具备以整体大局观来看待事务,提升自己的交流合作能力,表达能力和综合技能。


第2章 相关技术介绍

豆瓣电影数据采集与可视化分析系统是用当前应用很广泛的Python语言和Flask框架,并结合CSS与HTML搭建Web网页,使用MySQL数据库对数据进行存储,依次来开发实现系统的功能。本系统运行需要的软件有Pycharm、普通浏览器、Navicat for MySQL等。

2.1 爬虫技术

Request是代表HTTP请求的对象 在服务器接收到客户daunt发送的请求后,调用service方法处理请求之前,服务器会创建出代表请求的request对象(用于封装请求信息),再将request对象(和response对象)传递给service方法,调用service方法来处理请求。

2.2 pandas技术

Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。 Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。panel data是经济学中关于多维数据集的一个术语,在Pandas中也提供了panel的数据类型。

2.3 Echarts技术

Echarts 数据可视化框架通过Pandas数据分析框架我们从Mysql数据库拉到终端的数据集以及数据本体就不需要我们再对其进行处理。只需要交给Echarts可视化库即可。该库兼容当前大部分浏览器,(Chorme,Firefox,Safari等)能给用户提供直观,交互丰富,可高的个性化设置。提供了常见的统计表,我们需要做的就是封装好需要的数据类型以及数据格式传入到指定的实例化中即可。

2.4 MySQL介绍 

MySQL作为一种源码比较开源的 RDBMS,采用了目前最常见的数据库管理语言——结构式询问语言(SQL)来实现数据的处理。由于它的速度,可靠性和适应性, MySQL得到了广泛的重视。许多人都觉得 MySQL是不要求进行事务的最好的方法。

2.5 HTML介绍 

HTML是一种带有超文字标签的文字,是一种以超连接的形式来表达和整理用户需要的资讯的一种手段。它们可以在相同的文字中同时存在,也可以在其它的文档中存在,也可以在不同的电脑中存在。它把分散在各个地点的资料以一种任意的形式联系起来,便于用户寻找资料。

2.6 CSS介绍

分层风格表(英文全名:分层风格表)是一种用于表示诸如 HTML (一般标签语言的一种)、 XML (一般标签语言的一种)之类的文档风格的一种电脑语言。CSS不但能对页面进行静态的装饰,而且能与多种文字文字结合,对页面中的各个要素进行动态的格式设置。CSS可以在像素级别上准确地控制页面中的要素的放置,可以提供各种字体的大小,还可以实现页面的目标和模式的修改。

2.7 JavaScript介绍

JavaScript(Java脚本)是一种基于对象(Object)和事件驱动( Event Driven)并具有安全性能的脚本语言,使用JavaScript可以轻松的实现与HTML的互操作,并且完成丰富的页面交互效果,它是通过嵌入或调入在标准的HTML语言中实现的,它的出现弥补了HTML的缺陷,是java与HTML折衷的选择。

2.8 Xpath介绍 

Xpath,全称XML Path Language,即XML路径语言,可以在XML,HTML文档中查找信息的语言,XPath的选择功能十分强大,提供了非常简明了的路径选择表达式。有超过100个内建函数和几乎所有的定位节点都可以用来选择。使用前需要进行导入Lxml,通过etree格式化网页内容,最后进行发送网页请求、网页解析。  

2.9 Re介绍  

re模块就是正则表达式的应用 正则表达式对字符串的逻辑操作,主要是对字符串的一种过滤,用“元字符” 与“普通字符”组成一个字符串规则对已知的字符串或文本过滤出自己想要的字符串,本身是对事先定义好的特殊字符以及特定的字符串进行组合拼接。主要的使用范围是对字符串进行获取特定的部分,使用前需导入Re模块,其内置函数有:sub、search、match等通过与Xpath获取的数据进行配合使用。

第3章 系统需求分析

3.1 项目的必要性

近些年来,随着中国社会经济的高速发展,人们的休闲娱乐方式也越来月丰富,电影也走进的人们的生活,但是随着电影这几十年的发展,人们也逐渐对电影有了喜好的选择,有人喜欢剧情类型的电影、有人喜欢悬疑、有人喜欢科幻、有人喜欢动画,也有人专门喜欢一些导演的电影等等。因此,对于人们喜爱的电影类型、喜欢的导演进行分析、可视化,有助于行业内专业人士进行分析,创作出人们喜爱的电影、有利于提升行业内电影的质量,本文重点阐述了对豆瓣电影网的中国近10年电影数据的爬取,通过对豆瓣的网站分析,进一步对程序进行详细的设计以及对数据的可视化分析。运用Python语言以及其强大的多功能模块进行开发设计。通过环境概述、分析目标网站、进行数据采集清洗、数据可视化分析这几个部分,详细的说明了对豆瓣的中国近10年电影数据爬虫的开发过程,以及对电影数据进行相应的热度、喜爱种类类型、喜爱的导演等多方面进行可视化的数据分析。为电影行业提供相应的参考数据。

3.2 技术可行性

   技术上的可行性分析主要分析技术条件能否顺利完成开发工作,硬、软件能否满足开发者的需要等。该项目采用了Browser/Server模式进行开发。.Browser/Server体系结构紧密的结合了Intemnet/ Intranet技术,是技术发展的大势所趋,它把网站带入了一个崭新的发展时代。数据库服务器SQL数据库,它能够处理大量数据,同时保持数据的完整性并提供许多高级管理功能。它的灵活性、安全性和易用性为数据库编程提供了良好的条件。因此,项目的开发平台已成熟可行。

3.3 时间可行性

当前的爬虫技术已经十分的成熟,在一定规定的时间内可以爬取大量的数据。

3.4 经济可行性

   爬取技术目前不需要任何成本,仅需要爬虫语言代码在相应的软件上即可完成,仅有少部分数据可能需要支付相关的数据产权费用,在经济方面也是可行的。

运行截图

推荐项目

上万套Java、Python、大数据、机器学习、深度学习等高级选题(源码+lw+部署文档+讲解等)

项目案例

优势

1-项目均为博主学习开发自研,适合新手入门和学习使用

2-所有源码均一手开发,不是模版!不容易跟班里人重复!

🍅✌感兴趣的可以先收藏起来,点赞关注不迷路,想学习更多项目可以查看主页,大家在毕设选题,项目代码以及论文编写等相关问题都可以给我留言咨询,希望可以帮助同学们顺利毕业!🍅✌

源码获取方式

🍅由于篇幅限制,获取完整文章或源码、代做项目的,拉到文章底部即可看到个人联系方式。🍅

点赞、收藏、关注,不迷路,下方查看👇🏻获取联系方式👇🏻

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

B站计算机毕业设计大学

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值