Pandas.DataFrame Merge两个表时的效率对比和加速方法
Pandas.DataFrame Merge两个表时的效率对比和加速方法借用Riiid的数据集进行实验对比。方法1: 直接merge方法2先设置index为merge的公共列, eg: df_user.index.name = ‘user_id’然后再merge,使用参数: right_index = True可以看到,相较于原始的merge方法。新的方法有13x倍的加速效果。方法3先设置index为merge的公共列, eg: df_user.index.name = ‘user
原创
2020-12-02 16:17:52 ·
8650 阅读 ·
3 评论