Series 入门(创建和增删改查)

最新推荐文章于 2024-09-16 08:45:58 发布

转载最新推荐文章于 2024-09-16 08:45:58 发布 · 455 阅读

文章标签：

#python #大数据

本文深入讲解Pandas库中的Series数据结构，包括创建方法、索引操作、数据的增删改查，以及如何通过字典创建Series，是数据分析和数据科学初学者的必备指南。

Series 是pandas两大数据结构中（DataFrame，Series）的一种。使用pandas 前需要将pandas 模块引入，因为Series和DataFrame用的次数非常多，所以将其引入本地命名空间中会更方便。

from pandas import Series, DataFrame
import pandas as pd

因此，一般在代码中看到pd.，都指的是pandas。

1.创建Series

Series的定义：Series是一种类似于一维数组的对象，它由一组数据（各种NumPy数据类型）以及一组与之相关的数据标签（即索引）组成。

Series对象本质上是一个NumPy的数组，因此NumPy的数组处理函数可以直接对Series进行处理。但是Series除了可以使用位置作为下标存取元素之外，还可以使用标签下标存取元素，这一点和字典相似。每个Series对象实际上都由两个数组组成：

index: 它是从NumPy数组继承的Index对象，保存标签信息。
values: 保存值的NumPy数组。

注意三点：

1. Series是一种类似于一维数组（数组：ndarray）的对象

2. 它的数据类型没有限制（各种NumPy数据类型）

3. 它有索引，把索引当做数据的标签（key）看待，这样就类似字典了（只是类似，实质上市数组）

4.Series同时具有数组和字典的功能，因此它也支持一些字典的方法

创建数组，例如：

In [1]:arr=[1,2,3,4] #创建数组
In [2]:arr
Out[2]: [1, 2, 3, 4]

创建Series:

series_1=Series(arr)
series_1
Out[146]:
0 1
1 2
2 3
3 4
dtype: int64
series_2=Series([1,2,3,4])
series_2
Out[148]:
0 1
1 2
2 3
3 4
dtype: int64

创建包含多种数据类型的Series：

series_3=Series([1,2,'3',4,'a']) <span style="font-family: Arial, Helvetica, sans-serif;">#包含数字和字符串</span>
series_3
Out[150]:
0 1
1 2
2 3
3 4
4 a
dtype: object #类型变成了字符串