CDNOW 用户消费数据情况分析(python)(入门案例)

本文通过Python进行CDNOW用户消费数据的全面分析,包括数据类型处理、按月数据分析、用户个体消费分析和消费行为分析。利用pandas和matplotlib等库,展示了用户每月消费金额、产品购买量、消费总次数等关键指标,并探讨了用户生命周期的不同阶段。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import numpy as np
import pandas as pd
from pandas import DataFrame,Series
import matplotlib as mpl
import matplotlib.pyplot as plt

第一部分:数据类型处理

  • 数据加载
    • 字段含义:
      • user_id:用户ID
      • order_dt:购买日期
      • order_product:购买产品的数量
      • order_amount:购买金额
  • 观察数据
    • 查看数据的数据类型
    • 数据中是否存储在缺失值
    • 将order_dt转换成时间类型
    • 查看数据的统计描述
      • 计算所有用户购买商品的平均数量
      • 计算所有用户购买商品的平均花费
    • 在源数据中添加一列表示月份:astype(‘datetime64[M]’)

df = pd.read_csv(’./CDNOW_master.txt’,header=None,sep=’\s+’,names=[‘用户ID’,‘购买日期’,‘购买产品的数量’,‘购买金额’])
df

df.info()

df[‘购买日期’] = pd.to_datetime(df[‘购买日期’],format=’%Y%m%d’)

df

df.isnull().any(axis=0)

df.describe()

  • 计算所有用户购买商品的平均数量

  • 计算所有用户购买商品的平均花费

  •  2.410040       35.893648
    
  • 在源数据中添加一列表示月份:astype(‘datetime64[M]’)

  • 先取出数据的月份
    df[‘购买日期’].astype(‘datetime64[M]’)

df[‘month’]=df[‘购买日期’].astype(‘datetime64[M]’)

df.head()

第二部分:按月数据分析

  • 用户每月花费的总金额
    • 绘制曲线图展示
  • 所有用户每月的产品购买量
  • 所有用户每月的消费总次数
  • 统计每月的消费人数

df.groupby(‘month’)[‘购买金额’].sum()

plt.rcParams[‘font.sans-serif’] = [‘Simhei’] # 解决显示中文乱码问题
mpl.style.use(‘ggplot’)
fig = plt.figure(figsize=(8,5))
df.groupby(‘month’)[‘购买金额’].sum().plot()
plt.xlabel(‘日期’)
plt.ylabel(‘金额’)
plt.title(‘用户每月花费金额曲线图’)

  • 所有用户每月的产品购买量
    df.groupby(‘month’)[‘购买产品的数量’].sum()

plt.rcParams[‘font.sans-serif’] = [‘Simhei’]
mpl.style.use(‘ggplot’)
fig = plt.figure(figsize=(8,5))
df.groupby(‘month’)[‘购买产品的数量’].sum().plot()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值