无论男生,女生,面对黑丝的诱惑,都无法拒绝。大家日常又喜欢什么类型的黑丝呢?评论区写出你最喜欢的一款,听说新出现了很多不同类型的。
今天,Python栈-基和大家一起来看一下京东商城中,最火的黑丝产品,看看大家都喜欢购买何种类型的黑丝吧。
数据获取
当我们打开京东商城,输入关键词后,可以看到较火的一款黑丝商品是浪莎旗下的产品,有着10多万的评论。

点进商品详情页面后,通过对于网页页面的分析后,可以发现,不同的产品有着不同的Id信息。

所以我们首先要抓取所有的商品Id信息,并保存到本地。

上述的程序中,使用requests库请求网页源代码后,通过正则表达式来抓取各种丝袜型号的Id信息,并保存到本地的csv文件当中。
获取各种类型的评论数目
获得Id信息后,接下来我们就可以通过程序来获取到每种丝袜的评论数量。通过评论的数量,可以直观的反映出哪一种丝袜类型销量最高。

程序中,通过构造请求参数params来向url请求信息,通过json库来解析数据后,提取得到评论的数量。
得到的数量信息,可以通过可视化的方式来进行直观的展示。如下图所示。

从大家的评论数量统计中可以看到,超过半数的购买者,购买的丝袜是“黑色和肤色各买一双,是免脱开档的款式”。购买比基尼款式和加肥加大款式的的非常少。
这样的统计结果与大家日常中所观察到的情况非常的吻合。
获取各个款式的详细评论信息
接下来,为更进一步的进行分析,我们可以根据产品的不同Id获取用户的详细评论信息。

上图中,通过网页的分析,我们可以找到评论信息,并根据评论请求的链接,来构造请求信息。

上图程序中,4-13行是构造的请求参数,productId表示各个型号的产品Id,page表示的是抓取的当前页数。
15-21行则是通过requests库向url来请求数据,通过json来解析数据。
22-45行通过提取我们需要的关键数据后,通过save_data函数来将数据保存到本地。

提取到的数据如下图所示:

数据分析
接下来,我们对于数据,进行一下深入的分析。
首先我们来看一下,大家对于丝袜的评分分布是怎样的。

从上图中,大家的评分可以看出,绝大部分的评论者都给出了5分的评分,表明这款丝袜在质量方面是非常过硬的。大家可以放心购买。对于购买的月份分布,如下图所示。

无论男生,女生,面对黑丝的诱惑,都无法拒绝。大家日常又喜欢什么类型的黑丝呢?评论区写出你最喜欢的一款,听说新出现了很多不同类型的。
而对于大家的评论内容,则可以通过下图的词云进行展示。

从词云的展示结果可以看出,大家对于丝袜的质量是非常喜欢的,在手感、舒适程度以及性感展示方面都能够达到购买者的心理预期。最后,菜鸟哥将评论者的晒图通过爬虫爬取下来,保存到本地。一起来看看丝袜的上身效果吧。

总结
通过上面的内容,菜鸟哥带领大家利用Python来分析了有关于丝袜的一些内容知识。目前Python已经是连续5年蝉联了第一语言了,应用的范围非常广泛,可以做很多事情,而且入门简单,功能强大,你如果再不学就out啦!
python学习路线图
Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

Python 开发工具(破解版)
俗话说:工欲善其事,必先利其器,Python 的学习也是一样。

Python 学习书籍

Python视频合集
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

实战案例
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

Python练习题
检查学习结果

面试刷题
我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

本文通过Python爬虫技术分析了京东商城黑丝产品的评论数据,揭示了消费者偏好的款式及满意度。
364

被折叠的 条评论
为什么被折叠?



