作为数据分析师,在日常生活中我们会接触到各种各样的需求,其中excel更必不可少,面对庞大数据量,快速的需求我们该如何处理,这时Pandas就显得举足轻重,可以快速有效的处理表格数据,实现快速并准确的输出。
1.Pandas的数据结构详细介绍
Pandas中一共有三种数据结构,分别为Series(一维数据结构)、DataFrame(二维表格型数据结构)、Multilndex(三维数据结构)。
我们今天先来详细的了解下Series的内容:
Series是一个类似于一维数组的数据结构,它能够保存任何类型的数据,比如整数、字符串、浮点数等,主要由一组数据(value)和与之相关的索引(index)两部分构成。
1.1 Series的创建
#入 NumPy 并将 pandas 加载到您的命名空间中:
import pandas as pd
import numpy as np
pd.Series(data = None, index = None, dtype = None)
输出:Series([], dtype: float64)
"""
注释:参数:
data:传入的数据,可以是ndarray、list等
index:索引,必须是唯一的,且与数据的长度相等。如果没有传入索引参数,则默认会自动创建一个从0-N的整数索引。
dtype:数据的类型
"""
请看以下的相关实例:
- 指定内容,默认索引:
#创建一个Series通过传递值的列表,让Pandas创建一个默认的整数索引:
pd.Series([1,2,3,4,5,6,7,8,9,0])
输出:
0 1
1 2
2 3
3 4
4 5
5 6
6 7
7 8
8 9
9 0
dtype: int64

本文主要介绍了Pandas中的Series数据结构,包括其创建方式、属性、切片操作、dtype以及向量化操作和标签对齐特性。Series是一维数据结构,可以保存多种类型的数据,并通过索引进行便捷操作。其特有的标签对齐功能为数据分析提供了便利。
最低0.47元/天 解锁文章
688

被折叠的 条评论
为什么被折叠?



