最近参加一个小比赛,前期数据预处理搞得我头昏脑胀。特别是以下这类数据的转换,发现pivot函数后,真香,真好用!
话不多说直接上图示例数据(test_df为DataFrame对象)
我需要转换成以device_id为索引,app_id为各列名,num为元素值
其实这个数据我解释下,就好理解我为什么需要这样转换了。
首先device_id是设备id,app_id是对应设备使用的app的id,num则是对应device_id设备使用某app的次数
但我想要的数据是拿来进行每个device_id作为样本输入的,好了解释完毕,上函数
df = test_df.pivot(index='device_id', values='num', columns='app_id')
输出结果:
嘿嘿,美滋滋!