从情境中学习数据分析,体会数据分析逻辑。
今天的案例是关于化妆品电商平台的分享哦
首先,第一步,就是查看数据基本情况以及数据预处理主要有'事件时间','事件类型','产品id','产品类别id','产品类别代码','品牌','价格','用户id','用户会话'这几个变量
1、5个表的数据读取以及拼接,最终合成为20692840行, 9个字段的数据。数据量较为庞大。因此在后续的数据处理过程中,要尽量关注内存消耗情况,及时删除不必要的变量释放内存,并且尽量使用性能较好的代码实现方式。
2、统计总计有四种事件类型,分别为浏览、加入购物车、移出购物车、购买。54571种产品,525个产品类别,273个品牌。
3、提取年份、月份、日、周数据方便后续进行分析。
4、查看数据缺失情况,发现产品类别代码有98.29%的缺失值,品牌也有42.3%的缺失值,其他数据并无缺失值。
5、数据无重复值。
第二步呢,我们进行的是对用户的分析
在业务数据分析中,一个很重要的分析思路,便是“人货场” 的分析方法那么对应本次的化妆品电商平台,“人”便是用户数据,包括用户属性、用户行为等,“货”便是产品,包括产品销售额、销量等,而场应该是不同的“商家”,由于本次数据并没有提供相应的商家信息,因此我们从人、货两个角度进行数据分析。首先是“人”的角度,即用户分析。在本项目中,从用户角度衡量的数据有UV(访客数)、PV(访问量)、客单价、月复购率。当然,如果继续挖掘,还可以有很多指标可以罗列,具体的通常要根据业务需求以及分析需要进行提取 首先来看UV(访客数)日UV定义:一天内发生过任何行为的去重后用户数。即一天内用户多次访问也只计为一次。
月UV定义:一月内发生过任何行为的去重后用户数。即一月内用户多次访问也只计为一次。
计算每日的UV
计算每月的UV
日UV变化图
月UV变化图
一通分析之后我们来总结一下:
通过观察日UV变化