Python爬取猫眼评分9.5的《海王》的3万条评论


前言

2018年12月7日,本年度最后一部压轴大片《海王》如期上映,目前猫眼评分达到9.5分,靠着1.5亿美金的制作成本,以小博大,目前票房接近9亿,本文爬取了猫眼3w+条评论,多方位带你解读是否值得一看!!其实(yin)我(wei)也(mei)没(qian)看!


Python学习资料或者需要代码、视频加Python学习群:960410445

数据爬取

现在猫眼电影网页似乎已经全部服务端渲染了,没有发现相应的评论接口,参考了之前其他文章中对于猫眼数据的爬取方法,找到了评论接口!

m.maoyan.com/mmdb/commen…


接口有了,但是没有对应的电影id,不过这难不倒我们,使用猫眼app+charles,我们成功找到海王对应的电影ID;


接下来爬取评论:


解析接口返回数据


处理链接及存储数据



最终我们获取到了大约33000条数据


数据分析

数据分析我们使用了百度的pyecharts、excel以及使用wordcloud生成词云

首先看一下,评论分布热力图:


观众分布热力图

京津冀、长三角、珠三角等在各种榜单长期霸榜单的区域,在热力图中,依然占据着重要地位。而新一线的川渝、郑州武汉紧随其后!

下面是评论数前20的城市


评论数主要分布城市

评论全国分布图:


评论分布城市

由图中可以看出基本与热力图相似,主要分布在各大一线、新一线城市,对于杭州为何会排在第17的位置,我觉得可能是阿里大本营,大家都用淘票票的缘故吧!:smile::smile:

接下来是评分占比情况


评分占比.png

由图中可以看出,评分在4以上的占比达到了94%,而平均评分也达到4.68分!!!

再来看一下各城市评分情况:


各城市评分

看了评分再来看看评论的词云情况:


哈哈哈




词云出现较多的是好看、特效、剧情、震撼等,可以看出大家对此电影对特效和剧情还是十分认同的,毕竟烂番茄新鲜度73%,1.5亿美元对制作能做到如此实属不易,我还是决定这周末去影院刷一下的!

词云代码



综上,我觉得没看的小伙伴可以跟我一样一起周末去贡献一下票房了!哈哈哈哈

转载于:https://juejin.im/post/5c13216f5188251d9e0c717b

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值