·av68916814
流量指标:
PV:APP总访问量
UV:APP独立访问数
还可以根据时间、日期等进行追踪,查看用户访问规律
数据清洗公式:
1、缺失值统计:
isnull().sum()
shape方法
2、缺失值处理:
drop方法删除
补全
筛选方法
3、数据类型归一:
整数astype(int)
浮点数astype(float)
时间处理
4、数值统计找到异常值:
describe方法看最大值、最小值,确定有无异常
筛选方法 testdata[ testdata[' '] <=0 ]
5、删除重复行
drop_duplicates方法
映射:
type_arr = {1:'pv',2:'fav'}
testdata['behavior_type'].map(lambda x: type_arr[x])
.concat([a,b] , axis=1) 按列合并表
分析各个流程的转化漏斗,转化率为多少

购买的用户数及用户的复购率为多少

本文介绍了数据分析中的关键步骤,包括流量指标如PV和UV的追踪,数据清洗的方法如处理缺失值和异常值,以及数据类型归一化。通过describe方法识别异常值,drop_duplicates删除重复行,并应用映射函数进行数据转换。此外,文章还讨论了转化漏斗分析、用户复购率计算以及RFM模型在用户分层和运营策略制定中的应用。
最低0.47元/天 解锁文章
1438

被折叠的 条评论
为什么被折叠?



