from pandas import Series,DataFrame
import pandas as pd
import time
data = pd.read_excel(r'C:\Users\Administrator\Desktop\近半年数据.xlsx')
t_list=[]
for i in data['最后登录时间']:
i=str(i)
t1=time.strptime(i,"%Y/%m/%d %H:%M:%S")
t2=time.strftime("%Y/%m/%d",t1)
t_list.append(t2)
#将列表添加进原本的表格数据中
data['最后登录的时间']=t_list
#删除原本的日期
del data['最后登录时间']
#========1.1===================================================
a = data.loc[(data['成功购买次数'] == 0)&(data['拉起支付次数'] >= 1)]
a.to_excel(r'C:\Users\Administrator\Desktop\用户分类\用户多次拉起支付未付费.xlsx')
#========1.2==================================================
b = data.loc[(data['招投标阅读次数'] >= 30)&(data['总登录次数'] >= 3)&(data['成功购买次数'] == 0)&(data['拉起支付次数'] == 0)]
b.to_excel(r'C:\Users\Administrator\Desktop\用户分类\用户多次使用未付费.xlsx')
#========1.3==================================================
data1=data[-data['最后登录的时间'].isin(['0001/01/01'])]
c = data1.loc[(data1['最后登录的时间'] <= '2019/08/18')]
c.to_excel(r'C:\Users\Administrator\Desktop\用户分类\用户长久未登录.xlsx')
#=======1.4======================================================
drop_ID = list(set(list(a['ID'].values) + list(b['ID'].values)+ list(c['ID'].values))) ####set() 函数创建一个无序不重复元素集,可进行关系测试,删除重复数据
d1 = data.copy()
for i in drop_ID:
index = d1[d1.ID == i].index.tolist() ###tolist将数组或矩阵转换为列表
d1.drop(index,inplace=True) ###drop 要根据索引删除掉1、2中的用户ID这一行的数据
d = d1.loc[(data['续费次数'] == 0)&(data['总登录次数'] > 0)&(data['成功购买次数'] == 0)&(data['拉起支付次数'] == 0)&(data['招投标阅读次数'] == 0)&(data['招投标收藏次数'] == 0)&(data['拟在建阅读次数'] == 0)&(data['拟在建收藏次数'] == 0)&(data['普通任务'] == '未做')&(data['超级任务'] == '未做')]
d.to_excel(r'C:\Users\Administrator\Desktop\用户分类\用户只登录未操作.xlsx')
#========2.1===================================================
e = data.loc[(data['成功购买次数'] == 0)&(data['用户角色'] == '普通注册用户')&(data['过期时间'] <= '2019/10/18')&(data['过期时间'] <= '2019/10/18')&((data['普通任务'] == '已完成')|(data['超级任务'] == '已完成'))]
e.to_excel(r'C:\Users\Administrator\Desktop\用户分类\试用过期没付费(完成任务).xlsx')
#========2.1===================================================
f = data.loc[(data['成功购买次数'] == 0)&(data['用户角色'] == '普通注册用户')&(data['过期时间'] <= '2019/10/18')&(data['过期时间'] <= '2019/10/18')&(data['普通任务'] != '已完成')&(data['超级任务'] != '已完成')]
f.to_excel(r'C:\Users\Administrator\Desktop\用户分类\试用过期没付费(未完成任务).xlsx')
#========2.2===================================================
g = data.loc[(data['用户角色'].str.contains('VIP'))&(data['过期时间'] <= '2019/10/18')]
g.to_excel(r'C:\Users\Administrator\Desktop\用户分类\会员已过期未续费.xlsx')
#========2.3===================================================
h = data.loc[(data['用户角色'] == '普通注册用户')&(data['过期时间'] >= '2019/10/18')]
h.to_excel(r'C:\Users\Administrator\Desktop\用户分类\试用期.xlsx')
#========2.4===================================================
i = data.loc[(data['用户角色'].str.contains('VIP'))&(data['过期时间'] >= '2019/10/18')]
i.to_excel(r'C:\Users\Administrator\Desktop\用户分类\会员有效期内.xlsx')
用户分类 excel数据
用户行为分析与分类
最新推荐文章于 2023-04-06 11:29:07 发布
本文通过Python和Pandas库对用户数据进行预处理和筛选,实现了对用户行为的深入分析和分类,包括从未付费但频繁使用的用户到仅登录未操作的用户等不同类别,为业务决策提供了数据支持。
部署运行你感兴趣的模型镜像
您可能感兴趣的与本文相关的镜像
Wan2.2-T2V-A5B
文生视频
Wan2.2
Wan2.2是由通义万相开源高效文本到视频生成模型,是有50亿参数的轻量级视频生成模型,专为快速内容创作优化。支持480P视频生成,具备优秀的时序连贯性和运动推理能力
1239

被折叠的 条评论
为什么被折叠?



