from pandas import Series,DataFrame
import pandas as pd
import time
data = pd.read_excel(r'C:\Users\Administrator\Desktop\近半年数据.xlsx')
t_list=[]for i in data['最后登录时间']:
i=str(i)
t1=time.strptime(i,"%Y/%m/%d %H:%M:%S")
t2=time.strftime("%Y/%m/%d",t1)
t_list.append(t2)#将列表添加进原本的表格数据中
data['最后登录的时间']=t_list
#删除原本的日期del data['最后登录时间']#========1.1===================================================
a = data.loc[(data['成功购买次数']==0)&(data['拉起支付次数']>=1)]
a.to_excel(r'C:\Users\Administrator\Desktop\用户分类\用户多次拉起支付未付费.xlsx')#========1.2==================================================
b = data.loc[(data['招投标阅读次数']>=30)&(data['总登录次数']>=3)&(data['成功购买次数']==0)&(data['拉起支付次数']==0)]
b.to_excel(r'C:\Users\Administrator\Desktop\用户分类\用户多次使用未付费.xlsx')#========1.3==================================================
data1=data[-data['最后登录的时间'].isin(['0001/01/01'])]
c = data1.loc[(data1['最后登录的时间']<='2019/08/18')]
c.to_excel(r'C:\Users\Administrator\Desktop\用户分类\用户长久未登录.xlsx')#=======1.4======================================================
drop_ID =list(set(list(a['ID'].values)+list(b['ID'].values)+list(c['ID'].values)))####set() 函数创建一个无序不重复元素集,可进行关系测试,删除重复数据
d1 = data.copy()for i in drop_ID:
index = d1[d1.ID == i].index.tolist()###tolist将数组或矩阵转换为列表
d1.drop(index,inplace=True)###drop 要根据索引删除掉1、2中的用户ID这一行的数据
d = d1.loc[(data['续费次数']==0)&(data['总登录次数']>0)&(data['成功购买次数']==0)&(data['拉起支付次数']==0)&(data['招投标阅读次数']==0)&(data['招投标收藏次数']==0)&(data['拟在建阅读次数']==0)&(data['拟在建收藏次数']==0)&(data['普通任务']=='未做')&(data['超级任务']=='未做')]
d.to_excel(r'C:\Users\Administrator\Desktop\用户分类\用户只登录未操作.xlsx')#========2.1===================================================
e = data.loc[(data['成功购买次数']==0)&(data['用户角色']=='普通注册用户')&(data['过期时间']<='2019/10/18')&(data['过期时间']<='2019/10/18')&((data['普通任务']=='已完成')|(data['超级任务']=='已完成'))]
e.to_excel(r'C:\Users\Administrator\Desktop\用户分类\试用过期没付费(完成任务).xlsx')#========2.1===================================================
f = data.loc[(data['成功购买次数']==0)&(data['用户角色']=='普通注册用户')&(data['过期时间']<='2019/10/18')&(data['过期时间']<='2019/10/18')&(data['普通任务']!='已完成')&(data['超级任务']!='已完成')]
f.to_excel(r'C:\Users\Administrator\Desktop\用户分类\试用过期没付费(未完成任务).xlsx')#========2.2===================================================
g = data.loc[(data['用户角色'].str.contains('VIP'))&(data['过期时间']<='2019/10/18')]
g.to_excel(r'C:\Users\Administrator\Desktop\用户分类\会员已过期未续费.xlsx')#========2.3===================================================
h = data.loc[(data['用户角色']=='普通注册用户')&(data['过期时间']>='2019/10/18')]
h.to_excel(r'C:\Users\Administrator\Desktop\用户分类\试用期.xlsx')#========2.4===================================================
i = data.loc[(data['用户角色'].str.contains('VIP'))&(data['过期时间']>='2019/10/18')]
i.to_excel(r'C:\Users\Administrator\Desktop\用户分类\会员有效期内.xlsx')