数据分析可视化项目(二)--谷歌App store

本文分析了Google Play Store的数据,发现健康与健身、书籍与参考类应用评分最高,约会类应用评分最低。最佳应用大小在2MB~40MB之间,最佳价格区间在$1~$30。付费应用下载量少于免费应用,但用户倾向于为轻量级应用付费。评论数量与下载量呈中度正相关,评论有助于提升应用知名度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在这里插入图片描述

context

尽管许多公共数据集提供了Apple App Store数据,但在网络上的任何地方,都没有太多可用于Google Play Store应用程序的对应数据集。 深入研究后,我发现iTunes App Store页面部署了索引良好的附录式结构,以实现简单便捷的Web抓取。 另一方面,Google Play商店使用复杂的现代技术(例如动态页面加载)和JQuery,使抓取更具挑战性

content

每个应用程序(行)具有类别,等级,大小等的值。

Acknowledgements

该信息是从Google Play商店中抓取的

data preparation

在这里插入图片描述

在这里插入图片描述
首先我们有两个数据集,googleplaystore.csv(对谷歌appstore的统计)googleplaystore_user_reviews.csv(用户对谷歌appstore的评价)导入googleplaystore.csv里面有13列,对App的名字、种类、评分、回看次数,大小,下载量,价格。。。进行了统计

Data Clean

把Size属性列转化为M的形式

去除Install属性列的+并把它转化为numeric

使用Google翻译库将所有评论文本转换为英语

把Price价格的$去掉

在这里插入图片描述在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值