1、读取
1、读取整个Excel(默认读取第一个工作表)
data = pd.read_excel(file)
print(data)
2、#读取指定工作表(sheet_name可以为int,str,list)
data2 = pd.read_excel(file,sheet_name=[0,1,2])
print(data2)
3、#指定列作为行索引
data3 = pd.read_excel(file,sheet_name='时间表',index_col='时间')
print(data3)
4、#使用指定列(usecols)
data4 = pd.read_excel(file,sheet_name='时间表',header=1,names=['a','year','month','day'],index_col='a',usecols=['a','month'])
print(data4)
5、#匹配指定列(usecols)
usecols = ['年','year','month', '月','salary']
c = data3.columns[0:3]
print(c)
data5 = pd.read_excel(file,sheet_name='时间表',usecols = lambda c:c in set(usecols))
print(data5)
6、#指定标题
data6 = pd.read_excel(file,sheet_name='时间表',header=1,names=['a','year','month','day'])
print(data6)
7、#缺失值转化
data7 = pd.read_excel(file,sheet_name='时间表',keep_default_na=False)
print(data7)
8、#缺失值标记(将1标记为缺失值)
data8 = pd.read_excel(file,sheet_name='时间表',na_values=[1])
print(data7)
9、#缺失值忽略
data9 = pd.read_excel(file,sheet_name='时间表',na_filter=False)
print(data7)
10、#指定数据类型
data10 = pd.read_excel(file,sheet_name='时间表',header=1,dtype={'年':str,'月':'int32'})
print(data10)
2、保存
#保存excel数据
import pandas as pd
data = pd.DataFrame({'a':[1,2,3,4,5,6],'b':[1,2,3,4,5,6],'c':[7,8,9,10,11,12]})
print(data)
data.to_excel('D:\\data.xlsx')