1. apply() 匿名函数的使用
1.1 简单列操作
1.1.1 针对“注册日期”列计算已注册天数
备注:这种速度很慢!
# 使用apply()对某一列进行匿名函数映射
try:
today = datetime.datetime.today()
data['reg_days'] = data['reg_dt'].apply(
lambda x: (today - datetime.datetime.strptime(x, '%Y-%m-%d')).days)
except Exception as e:
print('no reg_dt label!')
1.1.2 数据类型转换
# 将各字段转为数值型,不能转换则跳过
df.apply(pd.to_numeric, errors='ignore')
df['aa'] = pd.to_numeric(df['aa'])
1.1.3 字段标准化处理
df['aa'] = df['aa'].apply(
lambda x: (x.astype(np.float64) - np.mean(x.astype(np.float64))) / (np.std(x.astype(np.float64)))+1)
# df['aa'] = df['aa'].apply(lambda x: (x - np.mean(x)) / (np.std(x))+1)
1.2 行转列
实现对applist列表的打散,形成N个app列(将applist json 打散成每个app为1列的格

本文围绕Pandas在数据分析中的应用展开。介绍了apply()匿名函数的使用,包括简单列操作如计算已注册天数、数据类型转换、字段标准化处理,以及行转列操作。还阐述了聚合函数的运用,如groupby()与agg()分组聚合,merge()按字段连接数据,并说明了不同拼接方式。
最低0.47元/天 解锁文章
1285

被折叠的 条评论
为什么被折叠?



