本文选取了淘宝电商平台的用户行为数据,从4个方面进行拆解和分析,完成了从数据清洗到可视化的一整套流程。
数据对于互联网+的商业模式存在巨大的价值,在业务中我们遇到的瓶颈往往通过数据分析,可以发现问题以及解决问题的对策。
本文对淘宝电商平台的用户行为数据进行分析:
报告梗概
报告背景及目的
目前电商已经进入到一个白热化的竞争阶段,增量的流量达到一定瓶颈后,商家就只能依靠对存量用户的精细化运营来提高转化,因此需要对用户的消费行为进行分析。提出优化平台运营的策略,从而为平台创造更多价值。
数据说明
数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成。
数据集含有5个字段,其含义如下:
字段名 | 字段含义 |
---|---|
user_id | 用户ID |
item_id | 商品ID |
category_id | 商品类目ID |
behavior_type | 行为类型:枚举类型,包括(‘pv’, ‘buy’, ‘cart’, ‘fav’) |
time_stamp | 行为发生的时间戳 |
数据预处理情况
重复值处理
整个数据集有100002条数据,其中完全重复的数据有2条,剔除后剩下100000条用户行为数据。
缺失值处理
数据集中无缺失值。
时间范围筛选
此数据集时间范围是11.25-12.03 ,删除时间范围之外的数据44条后剩下99956条用户行为数据。
新增字段
为方便后续的时间序列分析,新增行为时间datetimes字段(具体到年月日时分秒),行为日期dates字段,行为时hours等字段。
至此,数据预处理完成,截取部分有效数据如下所示:
AIPL模型分析
AIPL模型是常见的营销模型之一,包含认知、兴趣、购买和忠诚四个方面。针对此数据集中:
A:总浏览量
I:收藏加购量
P:购买量
L:复购量