代码
#导入模块
import pandas as pd
#读取数据文件
df1 = pd.read_excel('F:\作物种植生产数据\Python合并表格\【小麦种植生产数据】1980-2010.xlsx')
df2 = pd.read_excel('F:\作物种植生产数据\Python合并表格\【小麦种植生产数据】2011-2014.xlsx')
#合并数据
inner_join = pd.merge(df1,df2,on = '县级行政区',how = 'inner')
inner_join
说明
pandas是Python语言的一个程序扩展模块/库,用于数据分析:包括从CSV、Excel、SQL、JSON等各种类型文件导入数据,对各种数据进行归并、再成形、选择、清洗、加工等运算操作。
pandas名字衍生于“panel data”(面板数据)和“Python data analysis”(Python数据分析),该名称已说明了pandas的上述主要功能,pandas在学术、金融、统计学等各数据分析领域皆有广泛应用。
merge()函数:
left是参与合并的左侧DataFrame。
right是参与合并的右侧DataFrame。
on是用于连接的列名,必须同时存在拟合并的几个DataFrame中,若未指定,则以left和right两个DataFrame中列名的交集作为连接键。
how是数据连接方式,inner为内连接(默认),取各表的交集;outer为外连接,取各表的并集;left为左连接,取左侧表全部;right为右连接,取右侧表全部。