一、Series对象的创建Series是带标签的一维数组。创建的语法如下: pd.Series(data, index, dtype)
(1) data参数:可以是任意数据对象,比如列表、元组、range()函数、字典甚至是 NumPy 数组。 (2) index参数: 可省 (3) dtype参数:对数据类型进行设置,可省
1 通过列表、元组、range()函数创建如果index缺省,若index省略,则默认为0,1,2,...【例1】【例2】 可以写数据类型【例3】,如果dtype不写,会自动进行判断,推导时会找更高层级的数据类型。【例4】
例1:通过列表创建 结果:
不写index参数,则前面是0,1,2.。
例2:写了索引之后:
结果:
例3:写上数据类型
结果:
例4:
结果:
1.2 使用一维numpy数组创建还可以使用numpy数组来创建。
例1:
结果:
例2:
结果:
1.3 使用字典来创建如果不设定index,则默认以key作为index,value为data。【例1】 如果设定了index,则会到字典的key中筛选,找不到的,值设为NaN。【例2】
例1:通过字典来创建Series对象。
结果:
例2:
找不到Nanjing和Wuhan,所以显示NaN.
1.4 通过标量、字符串来创建当数据为标量或字符串时,类似“广播”机制。
例1:
结果:
例2:
结果:
二、DataFrame对象的创建Series的数值只有一列,而DataFrame可以有很多列。
创建语法: pd.DataFrame(data, index, columns)
data 数据,可以是列表、字典或Numpy数组 index 索引,可选。就是行的名字。 columns 列标签,可选。就是列的名字。
2.1 通过Series对象创建可以使用字典创建一个Series对象,然后使用这个Series对象创建DataFrame对象。【例1】【例2】
例1:
结果:
例2:可以给列起名字,使用
结果:
2.2 通过Series对象字典创建可以使用多个字典分别创建多个Series对象,然后使用这多个Series对象创建一个DataFrame对象。【例1】【例2】
例1:传入多个Series对象
结果:
可以看到数据一个来自于population,一个来自于GDP。
例2:
第三个数据是一个字符串。
结果:
会采用“广播”机制。
2.3 通过字典列表创建一个列表,里面有很多个字典。如,[{'a': 0, 'b': 0}, {'a': 1, 'b': 1}, {'a': 2, 'b': 4}] 通过字典创建的时候,键是列名。每个字典是一行数据。
例1:
结果:
例2:
结果:
2.4 通过字典创建
结果:
2.5 通过Numpy二维数组创建
结果:
|