Pandas对象的创建

本文介绍了如何在Python中利用Pandas库创建DataFrame和Series对象,涵盖了从字典、列表和其他数据源初始化的方法,以及设置索引和列名的细节。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

 

一、Series对象的创建

Series是带标签的一维数组。创建的语法如下:          

pd.Series(data, index, dtype)               

 

(1) data参数:可以是任意数据对象,比如列表、元组、range()函数、字典甚至是 NumPy 数组。

(2) index参数:  可省

(3) dtype参数:对数据类型进行设置,可省

 

1 通过列表、元组、range()函数创建

如果index缺省,若index省略,则默认为0,1,2,...【例1】【例2】

可以写数据类型【例3】,如果dtype不写,会自动进行判断,推导时会找更高层级的数据类型。【例4】

 

 

 

 例1:通过列表创建

结果:

 

不写index参数,则前面是0,1,2.。

 

 

例2:写了索引之后:

 

结果:

 

例3:写上数据类型

 

结果:

 

例4:

 

结果:

 

 

1.2 使用一维numpy数组创建

还可以使用numpy数组来创建。

 

例1:

 

结果:

 

例2:

 

结果:

 

1.3  使用字典来创建

如果不设定index,则默认以key作为index,value为data。【例1】

如果设定了index,则会到字典的key中筛选,找不到的,值设为NaN。【例2】

 

 

例1:通过字典来创建Series对象。

 

结果:

 

例2:


结果:

 

找不到Nanjing和Wuhan,所以显示NaN.

 

 

1.4 通过标量、字符串来创建

当数据为标量或字符串时,类似“广播”机制。

 

例1:

 

结果:

 

例2:

 

结果:

 

 

二、DataFrame对象的创建

Series的数值只有一列,而DataFrame可以有很多列。

 

创建语法:

pd.DataFrame(data, index, columns)

 

data  数据,可以是列表、字典或Numpy数组

index  索引,可选。就是行的名字。

columns  列标签,可选。就是列的名字。

 

 

2.1 通过Series对象创建

可以使用字典创建一个Series对象,然后使用这个Series对象创建DataFrame对象。【例1】【例2】

 

 

 

例1:

 

结果:

 

 

例2:可以给列起名字,使用

 

结果:

 

 

2.2 通过Series对象字典创建

可以使用多个字典分别创建多个Series对象,然后使用这多个Series对象创建一个DataFrame对象。【例1】【例2】

 

例1:传入多个Series对象

 

结果:

 

可以看到数据一个来自于population,一个来自于GDP。

 

例2:

 

第三个数据是一个字符串。

 

结果:

 

会采用“广播”机制。

 

 

2.3 通过字典列表创建

一个列表,里面有很多个字典。如,[{'a': 0, 'b': 0}, {'a': 1, 'b': 1}, {'a': 2, 'b': 4}]

通过字典创建的时候,键是列名。每个字典是一行数据。

 

例1:

 

结果:

 

 

例2:

 

结果:

 

 

2.4 通过字典创建

 

结果:

 

 

2.5 通过Numpy二维数组创建

 

结果:

 

 

 

 

 

 

 

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值