1. 项目背景:
通过对现有用户购物行为的数据进行分析,深度探索用户的消费行为、消费规律、消费偏好,针对不同的用户群体,以便更精细化运营,取得更好的业务;
2. 数据来源
数据来源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1
注:如果数据太大,可以通过系统抽样选取部分数据
UserBehavior是阿里巴巴提供的一个淘宝用户行为数据集,本数据集(UserBehavior.csv)包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢),数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔。
3. 从不同维度分析
第一个维度:用户购物情况整体分析
以PV、UV、平均访问量、跳失率等指标,分析用户最活跃的日期及活跃时段,了解用户行为习惯
第二个维度:商品购买情况分析
从成交量、人均购买次数、复购率等指标,探索用户对商品的购买偏好,了解商品的销售规律
第三个维度:用户行为转化漏斗分析
从收藏转化率、购物车转化率、成交转化率,对用户行为从浏览到购买进行漏斗分析
第四个维度:参照RFM模型,对用户进行分类,找出有价值的用户
4. 数据分析
分析步骤如下:
提出问题------理解数据------数据清洗------构建模型------数据可视化
一、 提出问题
用户最活跃的日期及时段
用户对商品有哪些购买偏好
用户行为间的转化情况
用户分类,哪些是有价值的用户
二、 理解数据
user_id | item_id | item_cat | beh_type | time_stamp |
---|---|---|---|---|
用户ID | 商品ID | 商品类目ID | 行为类型 | 时间戳 |
注意,用户行为有4种:
pv | fav | cart | buy |
---|---|---|---|
点击浏览 | 收藏商品 | 添加购物车 | 购买 |
三、 数据清洗
-
1 数据导入:在运行窗口中输入
net start mysql
启动SQL,再打开本地客户端SQLyog,从本地导入csv文件,注意先打开数据,大概扫下数据,并确认数据源中是否有标题行;