Pandas读取保存数据
学习目标
- 能够使用Pandas读写文件中的数据
- 知道Pandas读取数据时常用参数index_col、parse_dates、sheet_name、index的作用和用法
- 知道Pandas和MySQL数据库进行读写交互的方法
1 读写文件
常用读写文件函数清单【查表】无需记忆
文件格式 读取函数 写入函数 xlsx pd.read_excel df.to_excel xls pd.read_excel df.to_excel csv pd.read_csv df.to_csv tsv pd.read_csv df.to_csv json pd.read_json df.to_json html pd.read_html df.to_html sql pd.read_sql df.to_sql
1.1 Excel文件
-
保存数据
import pandas as pd data = [ [1, '张三', '1999-3-10', 18], [2, '李四', '2002-3-10', 15], [3, '王五', '1990-3-10', 33], [4, '隔壁老王', '1983-3-10', 40] ] # 创建df对象 df = pd.DataFrame(data=data, columns=['id', 'name', 'birthday', 'age']) # 保存数据 # sheet_name:表名 # index:是否保存df行索引值 # header:是否保存df列名 df.to_excel('./output/student.xls', sheet_name='student', index=False, header=True)
-
读取数据
student = pd.read_excel('./output/student.xls') print(student)
1.2 CSV文件
- 在CSV文件中,对于每一行,各列采用逗号
,
分隔;使用\n
换行符换行- 除了逗号,还可以使用其他类型的分隔符,比如TSV文件,使用制表符
\t
作为分隔符- CSV是数据协作和共享的首选格式,因为可以使用excel工具打开
-
保存数据
# 默认保存行索引, 默认使用逗号作为分隔符 df.to_csv('./output/s