像excel一样使用python,上一期介绍了生成、查看、替换等功能,这一期介绍数据预处理,包括数据表合并、排序、分组等。
1.合并
Excel里智能复制粘贴来合并表格,或者通过VLOOKUP函数分步实现。python中,可以直接使用merge函数来合并两个表,可选参数较多,这里只介绍最常用的几个参数:
df1.merge(df2,how='inner',on=None,left_on=None,right_on=None)
或:pandas.merge(df1,df2,how='inner'…)
将df1与df2合并,how为合并方式,有“inner、outer、left、right”4种选择,分别为“求交集、并集、固定左边、固定右边”。On代表用于连接的键名,如果两表合并对象的列名不同,使用left_on=None, right_on=None来分别指定。在默认情况下,merge会自动以重叠的列名按inner的方式合并。
importpandasaspd
frompandasimportDataFrame,Series
df1=DataFrame({ 'gene':['arx1','arx2','arx3','arx4'],
<
这篇博客介绍如何使用Python进行数据预处理,包括数据表的合并、排序、分组、分列、数据提取和筛选,展示了与Excel类似的处理方式。通过实例演示了merge、sort_values、sort_index、where、split、loc、iloc、isin和query等函数的应用。
最低0.47元/天 解锁文章
3566

被折叠的 条评论
为什么被折叠?



