Pandas的数据结构之Series

这篇博客详细介绍了Pandas的Series数据结构,包括如何创建Series,如何进行索引和切片,Series的基本概念,如它被视为定长的有序字典,并提供了获取属性的方法。此外,还讲解了Series的运算特性,如与numpy数组运算的兼容性,以及在Series之间运算时的自动对齐和缺失值处理策略。

Series是一种类似于一维数组的对象,由下面两个部分组成:

- values:一组数据(ndarray类型)
  • index:相关的数据索引标签
1.series的创建

两种创建方式
(1) 由列表或者numpy数组创建
n = np.array([1,2,3,4,5])
s = Series(n,index=list(‘ABCDE’)) # 可以设定index参数指定索引

特别地,由ndarray创建的是引用,而不是副本。对Series元素的改变也会改变原来的ndarray对象中的元素。(列表没有这种情况)

(2) 由字典创建
data_dict = {‘A’:1, ‘B’:2, ‘C’:3, ‘D’:4}
s = Series(data_dict)

2.Series的索引和切片

可以使用中括号取单个索引(此时返回的是元素类型),或者中括号里一个列表取多个索引(此时返回的仍然是一个Series类型)。分为显示索引和隐式索引:

(1) 显式索引:

  • 使用index中的元素作为索引值
  • 使用.loc[](推荐)
    注意,此时是闭区间

显示索引的两种方式
s[’’] 直接写中括号
s.loc[’’] 推荐写法

(2) 隐式索引:

  • 使用整数作为索引值
  • 使用.iloc[](推荐)
    注意,此时是半开区间

在series中,永远不要使用直接中括号进行索引

3.Series的基本概念

可以把Series看成一个定长的有序字典

可以通过shape,size,index,values等得到series的属性
s.head() 看前5条数据的样式
s.tail() 后5条

可以使用pd.isnull(),pd.notnull(),或自带isnull(),notnull()函数检测缺失数据

Series对象本身及其实例都有一个name属性

4.Series的运算
  1. 适用于numpy的数组运算也适用于Series
  2. (2) Series之间的运算
    - 在运算中自动对齐不同索引的数据
    - 如果索引不对应,则补NaN

当两个Series进行相加时,如果索引不对应,那么就会填补Nan
在这里插入图片描述
注意:要想保留所有的index,则需要使用.add()函数
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值