下面是一个实例:
#选取并构建LRFMC模型的特征
airline_selection = airline[["FFP_DATE","LOAD_TIME","FLIGHT_COUNT","LAST_TO_END",
"avg_discount","SEG_KM_SUM"]] #筛选多个列要用两个中括号
#构建L特征
L = pd.to_datetime(airline_selection["LOAD_TIME"]) - pd.to_datetime(airline_selection["FFP_DATE"])
#相减之后变成以day为单位的列
print(pd.to_datetime(airline_selection["LOAD_TIME"])[0:3])
print(L[0:3])
#下面两句实现了 225 days,将这个Timedelta转化为按月份计算的可以数值形式(int或float)
print("hhhhhhh:",L.dt.days[0:3]) #和下一条语句的是同样的效果
L = L.astype("str").str.split().str[0]
L = L.astype("int")/30 #天除以30得到月份
本文详细介绍如何从航空公司客户数据中选取并构建LRFMC模型的特征,包括使用pandas库进行日期转换、计算L特征(最近一次消费时间),并将时间差转化为月份数。
1583

被折叠的 条评论
为什么被折叠?



