小红书消费情况分析

资料来源

数据说明

这是一个关于用户在小红书购买金额的数据集, 共有29452条数据, 7个变量。
(1) Revenue 用户下单的购买金额
(2) 3rd_party_stores 用户过往在app中从第三方购买的数量,为0则代表只在自营商品中购买
(3) Gender 性别 1:男 0:女 未知则空缺
(4) Engaged_last_30 最近30天在app上有参与重点活动(讨论,卖家秀)
(5) Lifecycle 生命周期分为A,B,C (分别对应注册6个月内,1年内,2年内)
(6) days_since_last_order 最近一次下单距今的天数 (小于1则代表当天有下单)
(7)previous_order_amount 以往累积的用户购买金额

分析步骤

(1) 明确目的
(2) 提出问题
(3) 数据整理
(4) 数据可视化分析
(5) 建立数据模型

1. 分析目的

假设用户购买金额(revenue)为因变量, 其它六个变量为自变量, 探寻不同特征的人群对总购买金额的贡献大小, 帮助企业定位消费人群并在营销推广等方面做出更好决策。 综合所有变量建立多线性数据模型并分析数据模型的准确性。 准确的数据模型能够帮助预测用户下单金额。

提出问题:哪些消费群体更庞大,平均购买力更强?已知自变量能否准确预测用户购买金额?

提出问题:哪些消费群体更庞大,平均购买力更强?已知自变量能否准确预测用户购买金额?

数据整理:数据预处理

1. 数据导入
import pandas as pd
import numpy as np
import random
from matplotlib import pyplot as plt
from pyecharts.charts import Boxplot
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_boston
df= pd.read_csv("/home/kesci/input/data_hongshu5427/31 l2_week2.csv")
df.head(10)

在这里插入图片描述

2. 去除重复数值和缺失数值
df.drop_duplicates(inplace=True)
df.reset_index(drop=True,inplace=True)
df.replace('nan',np.nan,inplace=True)
###把性别、年龄、用户过往中为nan的数值分别用随机dummy variable、平均值、随机dummy variable替代
df.fillna(value={
   
   "gender":random.choice([1.0,0.0]),"age":round(df["age"].mean(),0),"engaged_last_30":random.choice([1.0,0.0])},inplace=True)
df.head(10)

在这里插入图片描述

3. 简化部分columns的命名, 方便之后绘图与处理
df=df.rename(columns={
   
   "engaged_last_30": "engage", df.keys()[5]: "last_order", "previous_order_amount":"accumulation", "3rd_party_stores":"3rd"})
df.head()

在这里插入图片描述

df.dtypes

在这里插入图片描述

数据分析:哪些消费群体更庞大, 平均购买力更强?

1. 先分析单一变量与利润的关系
###用matrix plot大致看一下变量之间的线性关系
import plotly.express as px
fig = px.scatter_matrix(df)
fig.show()
#从第一排的图像可以看出各个变量与利润的关系, 更详细的图如下:

在这里插入图片描述
通过变代码一一绘制每个单一变量与revenue的关系

#1.
plt.scatter(df['gender'], df['revenue'], color='purple')
plt.title('gender V
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值