import pandas as pd
import numpy as np
显示原始的DataFrame对象和分组聚合之后的DataFrame对象

1.修改聚合运算后的DataFrame对象的列名(因为列名和原始的数据列名重合了)
add_prefix():给列名添加前缀

2.将聚合运算后生成的DataFrame对象,合并到原来的DataFrame对象里(merge)
可以通过merge()将两张表进行连接
主键:数据表里唯一且非空的字段
外键:数据表用来和另一张数据表进行连接的字段
left_on:使用左边数据表的“外键”
right_on:使用右边数据表的“外键”
left_index:使用左边数据表的行索引
right_index:使用右边数据表的行索引

3.将聚合运算后生成的DataFrame对象,合并到原来的DataFrame对象里(transform)
先生成聚合后的DataFrame对象,并给列索引添加前缀

将聚合后的数据和原始数据进行连接

如果不想改变原来的初始数据,可以新建一个空白的DataFrame对象,然后添加原始数据和聚合后的数据
df_obj_new = pd.DataFrame()
df_obj_new[df_obj.columns] = df_obj
df_obj_new[df_obj_sum2.columns] = df_obj_sum2
也能得到同样的结果
本文介绍了如何在Pandas中对DataFrame进行分组和聚合操作,并详细阐述了如何处理聚合后的DataFrame列名冲突问题。通过add_prefix()方法添加列名前缀以避免重合。接着,讲解了利用merge()函数实现多表连接,重点说明了主键和外键的概念以及left_on, right_on, left_index, right_index参数的用法。最后,展示了如何使用transform生成聚合数据并将其与原始数据合并,创建新的DataFrame对象。"
86495742,5727915,高程数据转换到xi'an80或Beijing54坐标系指南,"['GIS', '坐标转换', '地图投影', 'CAD格式', '地理信息系统']
970

被折叠的 条评论
为什么被折叠?



