数据分析
取出退货的订单 使用透视图进行观察
df1 = df.loc[df['Quantity'] <= 0]
#使用透视图分析
tt = pd.pivot_table(df1,index=['year'],columns=['month'],values=['amount'],aggfunc={'amount':np.sum},margins=False)

取出除退货订单以外的已完成订单并观察
df2 = df[(df['Quantity'] > 0) & (df['Price'] > 0)]
#使用透视图分析
pp = pd.pivot_table(df2,index=['year'],columns=['month'],values=['amount'],aggfunc={'amount':np.sum},margins=False)

退货率=退货金额/合计金额

以2010年为例来画出退货率的折线图
#取出多列
df2010 = df[['year','month','Quantity','Price','amount']]
#取出2010年的记录
df2010 = df2010.loc[df2010['year'] == '2010']
#2010年每个月的
#合计金额
df2010_1 = df2010[(df2010['Quantity'] > 0) & (df2010['Price'] > 0)]
df2010_1 = df2010_1.groupby('month').sum()
#退货金额
df2010_0 = df2010[(df2010['Quantity'] < 0)]
df2010_0 = df2010_0.groupby('month').sum()
#2010年退货率
#退货率=退货金额/合计金额
th2010 = np.abs(df2010_0['amount']/df2010_1['amount'])
出来的结果是这样的:

顺序是错的
搜了一下怎么解决,看到一个思路是修改行名变成01 02 03
但是用th2010.index[]和th2011.renam

该博客主要探讨了电商平台的退货数据分析,通过计算退货率并绘制2010年的退货率折线图,发现1月和12月退货率较高。接着,博主介绍了RFM分层模型,用于理解消费者行为,分析了R、F、M三个指标,并对异常值进行了讨论。最后,根据RFM模型对客户进行价值分层,提出针对不同类型的客户采取差异化策略。
最低0.47元/天 解锁文章
3727

被折叠的 条评论
为什么被折叠?



