用户分类 excel数据

用户行为分析与分类

最新推荐文章于 2023-04-06 11:29:07 发布

原创最新推荐文章于 2023-04-06 11:29:07 发布 · 358 阅读

0 ·

CC 4.0 BY-SA版权

项目代码专栏收录该内容

8 篇文章

订阅专栏

本文通过Python和Pandas库对用户数据进行预处理和筛选，实现了对用户行为的深入分析和分类，包括从未付费但频繁使用的用户到仅登录未操作的用户等不同类别，为业务决策提供了数据支持。

部署运行你感兴趣的模型镜像

from pandas import Series,DataFrame
import pandas as pd
import time

data = pd.read_excel(r'C:\Users\Administrator\Desktop\近半年数据.xlsx')

t_list=[]
for i in data['最后登录时间']:
    i=str(i)
    t1=time.strptime(i,"%Y/%m/%d %H:%M:%S")
    t2=time.strftime("%Y/%m/%d",t1)
    t_list.append(t2)            
     
#将列表添加进原本的表格数据中
data['最后登录的时间']=t_list

#删除原本的日期
del data['最后登录时间']

#========1.1===================================================
a = data.loc[(data['成功购买次数'] == 0)&(data['拉起支付次数'] >= 1)]
a.to_excel(r'C:\Users\Administrator\Desktop\用户分类\用户多次拉起支付未付费.xlsx')

#========1.2==================================================
b = data.loc[(data['招投标阅读次数'] >= 30)&(data['总登录次数'] >= 3)&(data['成功购买次数'] == 0)&(data['拉起支付次数'] == 0)]
b.to_excel(r'C:\Users\Administrator\Desktop\用户分类\用户多次使用未付费.xlsx')

#========1.3==================================================    
data1=data[-data['最后登录的时间'].isin(['0001/01/01'])]       
           
c = data1.loc[(data1['最后登录的时间'] <= '2019/08/18')]
c.to_excel(r'C:\Users\Administrator\Desktop\用户分类\用户长久未登录.xlsx')

#=======1.4======================================================
drop_ID = list(set(list(a['ID'].values) + list(b['ID'].values)+ list(c['ID'].values)))  ####set() 函数创建一个无序不重复元素集，可进行关系测试，删除重复数据
d1 = data.copy()  
for i in drop_ID:
  index = d1[d1.ID == i].index.tolist()  ###tolist将数组或矩阵转换为列表
  d1.drop(index,inplace=True)   ###drop 要根据索引删除掉1、2中的用户ID这一行的数据

d = d1.loc[(data['续费次数'] == 0)&(data['总登录次数'] > 0)&(data['成功购买次数'] == 0)&(data['拉起支付次数'] == 0)&(data['招投标阅读次数'] == 0)&(data['招投标收藏次数'] == 0)&(data['拟在建阅读次数'] == 0)&(data['拟在建收藏次数'] == 0)&(data['普通任务'] == '未做')&(data['超级任务'] == '未做')]

d.to_excel(r'C:\Users\Administrator\Desktop\用户分类\用户只登录未操作.xlsx')

#========2.1===================================================
e = data.loc[(data['成功购买次数'] == 0)&(data['用户角色'] == '普通注册用户')&(data['过期时间'] <= '2019/10/18')&(data['过期时间'] <= '2019/10/18')&((data['普通任务'] == '已完成')|(data['超级任务'] == '已完成'))]

e.to_excel(r'C:\Users\Administrator\Desktop\用户分类\试用过期没付费（完成任务）.xlsx')

#========2.1===================================================
f = data.loc[(data['成功购买次数'] == 0)&(data['用户角色'] == '普通注册用户')&(data['过期时间'] <= '2019/10/18')&(data['过期时间'] <= '2019/10/18')&(data['普通任务'] != '已完成')&(data['超级任务'] != '已完成')]

f.to_excel(r'C:\Users\Administrator\Desktop\用户分类\试用过期没付费（未完成任务）.xlsx')

#========2.2===================================================
g = data.loc[(data['用户角色'].str.contains('VIP'))&(data['过期时间'] <= '2019/10/18')]

g.to_excel(r'C:\Users\Administrator\Desktop\用户分类\会员已过期未续费.xlsx')

#========2.3===================================================
h = data.loc[(data['用户角色'] == '普通注册用户')&(data['过期时间'] >= '2019/10/18')]

h.to_excel(r'C:\Users\Administrator\Desktop\用户分类\试用期.xlsx')

#========2.4===================================================
i = data.loc[(data['用户角色'].str.contains('VIP'))&(data['过期时间'] >= '2019/10/18')]

i.to_excel(r'C:\Users\Administrator\Desktop\用户分类\会员有效期内.xlsx')