Python学习笔记01: pandas.DataFrame的创建
1. DataFrame的基本概念
DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值,字符串、布尔值等)。DataFrame既有行索引也有列索引,可以看做由Series组成的字典(共用同一个索引)[1]。
2. DataFrame的创建
2.1 通过字典创建
利用pd.DataFrame()函数,通过输入一个由等长列表或NumPy数组组成的字典是创建数据框的常用方法,注意此时如果不指定列的顺序,列会按照默认方式排序。
# 1.导入pandas库
import pandas as pd
# 2.字典创建
Data_Dir = {'Province':['ShanDong','ZheJiang','JiangSu'],
'Year':[2000,2000,2000],
'Population':[9.0,5.7,8.1]}
# 3.数据框创建
Data_Frame = pd.DataFrame(Data_Dir)
print(Data_Frame)
由于没有指定列的顺序,此时print()函数的输出结果是:
Population Province Year
0 9.0 ShanDong 2000
1 5.7 ZheJiang 2000
2 8.1 JiangSu 2000
我们也可以在创建DataFrame的时候通过columns=[]指定列的顺序,比如:
# 1.导入pandas库
import pandas as pd
# 2.字典创建
Data_Dir = {'Province':['ShanDong','ZheJiang','JiangSu'],
'Year':[2000,2000,2000],
'Population':[9.0,5.7,8.1]}
# 3.数据框创建
Data_Frame = pd.DataFrame(Data_Dir,columns=['Province','Year','Population']) #指定列的顺序
print(Data_Frame)
此时的输出结果是:
Province Year Population
0 ShanDong 2000 9.0
1 ZheJiang 2000 5.7
2 JiangSu 2000 8.1
2.2 创建空DataFrame
我们也可以不通过字典,直接利用pd.DataFrame()创建空的DataFrame
import pandas as pd
# 1.创建空的数据框-方法1
DataFrame_1 = pd.DataFrame(columns=['Province','Year','GDP'])
print(DataFrame_1)
print('************************')
# 2.创建空的数据框-方法2
DataFrame_2 = pd.DataFrame(data=[],columns=['Province','Year','GDP'])
print(DataFrame_2)
此时创建的就是空的数据框,打印结果如下:
Empty DataFrame
Columns: [Province, Year, GDP]
Index: []
************************
Empty DataFrame
Columns: [Province, Year, GDP]
Index: []
参考资料
[1] 《利用Python进行数据分析》
菜根谭
待小人,不难于严,而难于不恶
待君子,不难于恭,而难于有礼