Series是一种类似于一维数组的对象,由下面两个部分组成:
- values:一组数据(ndarray类型)
- index:相关的数据索引标签
1.series的创建
两种创建方式
(1) 由列表或者numpy数组创建
n = np.array([1,2,3,4,5])
s = Series(n,index=list(‘ABCDE’)) # 可以设定index参数指定索引
特别地,由ndarray创建的是引用,而不是副本。对Series元素的改变也会改变原来的ndarray对象中的元素。(列表没有这种情况)
(2) 由字典创建
data_dict = {‘A’:1, ‘B’:2, ‘C’:3, ‘D’:4}
s = Series(data_dict)
2.Series的索引和切片
可以使用中括号取单个索引(此时返回的是元素类型),或者中括号里一个列表取多个索引(此时返回的仍然是一个Series类型)。分为显示索引和隐式索引:
(1) 显式索引:
- 使用index中的元素作为索引值
- 使用.loc[](推荐)
注意,此时是闭区间
显示索引的两种方式
s[’’] 直接写中括号
s.loc[’’] 推荐写法
(2) 隐式索引:
- 使用整数作为索引值
- 使用.iloc[](推荐)
注意,此时是半开区间
在series中,永远不要使用直接中括号进行索引
3.Series的基本概念
可以把Series看成一个定长的有序字典
可以通过shape,size,index,values等得到series的属性
s.head() 看前5条数据的样式
s.tail() 后5条
可以使用pd.isnull(),pd.notnull(),或自带isnull(),notnull()函数检测缺失数据
Series对象本身及其实例都有一个name属性
4.Series的运算
- 适用于numpy的数组运算也适用于Series
- (2) Series之间的运算
- 在运算中自动对齐不同索引的数据
- 如果索引不对应,则补NaN
当两个Series进行相加时,如果索引不对应,那么就会填补Nan

注意:要想保留所有的index,则需要使用.add()函数

这篇博客详细介绍了Pandas的Series数据结构,包括如何创建Series,如何进行索引和切片,Series的基本概念,如它被视为定长的有序字典,并提供了获取属性的方法。此外,还讲解了Series的运算特性,如与numpy数组运算的兼容性,以及在Series之间运算时的自动对齐和缺失值处理策略。
1249

被折叠的 条评论
为什么被折叠?



