DataFrame,中文叫数据框,是pandas模块最常用的数据类型,是一个二维的矩阵数据表。DataFrame,就像是一个表格,可以非常便捷地存放数据。
DataFrame,它由3部分组成:行索引(index),列索引(columns),值。通过index和columns,可以定位到一个值,能快速进行数据的筛选和定位。列和列之间的数据类型可以不同。
可以认为DataFrame是“具有相同index的Series的集合”,和Series类似,DataFrame的行索引index是可以选择性定义的。如果没有定义index,index就会默认从0开始生成。
3.1 导入pandas
import pandas as pd
3.2 创建数据框
df=pd.DataFrame(数据列表或数据字典,index=索引列表)
可以用字典生成数据框或者用列表生成数据框,二者的区别如下:
- 字典生成:字典的key是列名,值是一列数据的值
- 列表生成:列表是一行数据
以下是两个示例:
#用字典生成dataframe
import pandas as pd
data={'rank':[1,2,3,4],'GDP':[80855,77388,68024,47251]}#字典的key可以是''也可以是""
city=["GD","JS","SD","ZJ"]
df=