pandas(一)内部类型

最新推荐文章于 2024-05-16 13:25:57 发布

山上有多花

最新推荐文章于 2024-05-16 13:25:57 发布

阅读量850

点赞数 1

分类专栏： pandas精学文章标签： python pandas

本文链接：https://blog.youkuaiyun.com/qq_53694275/article/details/122201506

版权

pandas精学专栏收录该内容

2 篇文章

订阅专栏

本文介绍了pandas库的基础知识，包括Series数据类型的创建、属性及操作，如通过pd.Series()函数定义Series，使用.values、.index和.name属性获取数据。接着讲解了DataFrame，它是由Series组成的字典，具备行和列索引。最后提到了.loc函数用于按行索引获取DataFrame数据。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.介绍

pandas 库可谓是数据分析十分强大的库，接下来几天我会开始着手写pandas库的基础知识。一般导入格式为：import pandas as pd

2.数据类型Series

函数原型：pd.Series( data, index, dtype, name, copy)

参数解读：data：ndarray数据或字典

index：数据索引标签，如果不指定，默认从 0 开始。

其中index未指定时为RangeIndex[start，stop，end)对象

dtype：数据类型

name：类似于excel表头名，可以不加

copy：拷贝数据，默认为 False

Series类型常用操作：

属性	作用
对象.values	返回ndarray数组
对象.index	返回index索引
对象.name	放回name名字
对象.index.name	index索引的名字

import pandas as pd
a = pd.Series([1, 2, 3], index=[1, 2, 3], name='test')
a_values = a.values
a_index = a.index
a_name = a.name
index_name = a.index.name  # None
print('a的ndarray数组是{}\na的index是{}\na的name是{}'.format(a_values, a_index,a_name))

"""
结果是：
a的ndarray数组是[1 2 3]
a的index是Int64Index([1, 2, 3], dtype='int64')
a的name是test

"""