什么是csv?
csv是一种文件格式,全称为逗号分割值文件,可以理解为一种表格数据。通常从电子表格和数据库导出数据以及在其他程序中导入数据的文件格式。
怎么在python中使用csv
import pandas as pd#引入pandas库
pd_data = pd.DataFrame(data,columns=[‘total_num’,‘left_num’,‘weather’,‘influence_school’]#用来将数组转换为data frame格式,data换为你的数组,columns中设置列名
pd_data.to_csv(‘pd_data.csv’)#转存为csv文件,第一行为列名
heart_data = pd.read_csv(“pd_data.csv”)#读取csv文件,并默认从第二行读取,列名忽略
需要注意一点参数问题:
header:表头,默认不为空(为 0,也即将第一行视为表头)。如果我们要读取的文件,直接就是数据,没有所谓的表头。就需指定 header=None,否则将以文件的第一行作为 df.columns。
后续处理
heart_data = pd.read_csv(“pd_data.csv”)返回的是一个data frame的类型
创建DataFrame
下面引用一下别人的总结:
from pandas import DataFrame
## 创建DataFrame ##
In [0]:
DataFrame({'col0':[1,2,3], 'col1':[4,5,6]})
Out[0]:
col0 col1
0 1 4
1 2 5
2 3 6
In [1]:
data = {'col0':[1,2,3], 'col1':[4,5,6]}
DataFrame(data,columns = ['col1','col0'])
Out[1]:
col1 col0
0 4 1
1 5 2
2 6 3
In [2]:
DataFrame(data,columns = ['col1','col0','col2'])
Out[2]:
col1 col0 col2
0 4 1 NaN
1 5 2 NaN
2 6 3 NaN
## 获取数据 ##
frame = DataFrame({'col0':[1,2,3], 'col1':[4,5,6]})
In [3]:
frame['col1']
Out[3]:
0 4
1 5
2 6
Name: col1, dtype: int64
In [4]:
frame.col1
Out[4]:
0 4
1 5
2 6
Name: col1, dtype: int64
## 删除数据 ##
del frame['col1']
In [5]:
frame
Out[5]:
col0
0 1
1 2
2 3