数据的写入
写入csv
csv是最为常见的以纯文本文件存储数据文件的格式,它的优点是通用性很强,不受操作系统以及具体的软件的限制。
import pandas as pd
df_dict = {
'name':['ZhangSan','LiSi','WangWu','ZhaoLiu'],
'age':['18','20','19','22'],
'weight':['50','55','60','80']
}
df = pd.DataFrame(data=df_dict,index=['001','002','003','004'])
print(df)
name age weight
001 ZhangSan 18 50
002 LiSi 20 55
003 WangWu 19 60
004 ZhaoLiu 22 80
# 写入csv,path_or_buf为写入文本文件
df.to_csv(path_or_buf='./Information.csv', encoding='utf_8_sig')
# 相对路径,./表示当前路径下,../表示上一级目录
print('end')
end
从结果中可以发现,to_csv()
保存数据时,df
的行索引作为一列被输出到csv文件中。如何在保存csv文件的时候,不存储DataFrame的行索引信息呢?
df.to_csv(path_or_buf='./People_Information.csv',index=False,encoding='utf_8_sig') # index设为False就能不保存行索引信息
写入excel
# 写入excel
df.to_excel('./Information.xlsx', encoding='utf_8') # ./表示当前路径下
print('end')
end
数据的读取
csv的读取
import pandas as pd
df = pd.read_csv('./Information.csv')
print(df)
print(df.shape)
Unnamed: 0 name age weight
0 1 ZhangSan 18 50
1 2 LiSi 20 55
2 3 WangWu 19 60
3 4 ZhaoLiu 22 80
(4, 4)
调用read_csv()
方法并传入文件的路径,就可以将数据读取出来并且是DataFrame类型。read_csv()
默认会将文件中的第一行作为数据的列索引。
若第一条数据不符合作为列索引的要求,需要自己修改,可以利用read_csv()
中的header
参数根据位置下标进行选择哪一行作为列索引。
df = pd.read_csv('./Information.csv',header=行位置下标)
# read_csv()的header参数默认是0,取第一行的值。
# 如果都不满足的你的要求,可以将header设置为None,列索引值会使用默认的1、2、3、4,之后在自行设置。
# 另外,当指定了header的值,读出来的数据就是从该行开始向下切片,该行以上的数据会被忽略。
excel的读取
import pandas as pd
sheet1 = pd.read_excel('./sheet.xlsx',sheet_name='sheet1') # sheet_name可指定读取哪个工作表