前些日子潘老师领衔主演的《鬼吹灯之龙岭迷窟》,让盗墓题材的影视剧再次热起来,这股热乎劲还没过去多久,紧接着,这些天,又另一盗墓小说《盗墓笔记》改编的电视剧《重启之极海听雷》又跟大家见面了。
同样是盗墓题材类的影视剧,而且主角是当红演员朱一龙。豆瓣上给出了7.8分的评分,说明制作上和演员的表演也是过关的。今天小编就带领大家来爬取一下大家对这部剧的评论,看一下大家是如何看待这部电视剧的。
1
数据的抓取
首先是对于数据的抓取,小编获取的是爱奇艺下每集电视剧中,观影者对于该集的评价,小编爬取了前五集的一共6万条评论。我们首先需要明确该去如何获取数据呢,如下所示:
我们首先需要根据动态加载的评论,按键盘的F12,打开开发者模式,在开发者模式的network里找到评论的json数据,然后根据其请求的url链接来构建我们的爬虫程序。小编根据上述步骤,写出了对应的爬虫层序,其部分核心程序如下图所示:
上述程序中,首先需要根据基础的url链接,构建实际的爬虫链接,然后获取返回的json数据,并对json数据进行解析,获取我们需要的数据。这里,小编获取到的是评论者的用户名、性别、评论内容,被点赞数和评论的时间等信息。一共有6万条数据。
2
数据分析
在获取到数据之后,接下来就是对于数据的分析了,从数据中,我们能够获取到非常多的有趣的内容。首先,由于朱一龙的存在,所以我们首先要看的就是评论者的性别分布,如下所示:
可以看到,忽略0.8%的性别未知的观众,评论这部影视剧的女性远远超过了男性,女性评论者数量达到了男性的四倍以上,而这里里面的女性评论者绝大部分都是冲着男主朱一龙来的,这里我们在后面的词云分析中也能看出。
对于每一位评语,我们可以看到,绝大多数人的评语都没有收获到点赞,这也符合我们的认知,因为爱奇艺只会将精彩的评论置顶,因此绝大部分评论都不会有观影者特地去点赞。收到0条点赞也是正常的。
对于每集评论数量的分布,可以看到,随着剧集的发展,每一集的评论数量也随之缓慢的下降,当然,这也跟电视剧播出的时间是有很大的关系的,毕竟播出时间早的剧集,评论的人数概率上比后播放的人数自然要多。
对于每天的评论数和点赞数,如下图所示:
可以看到,从8月5日到8月9日的这五天时间里,评论数量发生了巨大的波动,从8月7日开始,评论数量出现了巨大的滑坡,但是点赞数量已经保持着稳定的水平。
对于大家的评论,我们来看一下是如何大家的看法:
对于这部电视剧,很大一部分观众是冲着男主角朱一龙来的,无论是他本人还是饰演的“吴邪”角色。这与前面关于观影者以女性居多相呼应。此外这部剧大家的评论也是不错的,认为比较好看,喜欢这部电视剧。
以上就是小编为大家带来的关于《重启之极海听雷》这部影视剧的数据抓取和词云分析,欢迎大家留言吱一声,说一下你心中关于这部电视剧的评论。小编也正在追这部剧,个人认为是比较不错的,也会持续的追下去,嘿嘿。
视觉+图像主题 热门原创:
80行代码!用Python做一个哆来A梦分身
用Python一键生成炫酷九宫格图片,火了朋友圈
熬了一夜!我用Python做了一个网站,帮小姐姐生成漫画头像
用Python实现Instagram滤镜,变成百变女神!
有点玄乎!用Python分析《隐秘的角落》里微表情
菜鸟编程大本营,现已正式上线!
接下来我们将会在该公众号上,为大家分享优质编程语言里趣味的干货,通俗易懂的实战案例,经验分享,让菜鸟也爱上编程。
长按2秒,输入【福利】
点这里,进菜鸟学PythonB站大本营