pandas三种结构的基本操作

本文详细介绍Pandas库中Series和DataFrame的基本操作,包括数据访问、数据类型查看、描述性统计信息获取等,并通过实例展示如何应用这些功能进行数据处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Series系列基本操作

编号属性或方法描述
1axes返回行轴标签列表。
2dtype返回对象的数据类型(dtype)。
3empty如果系列为空,则返回True。
4ndim返回底层数据的维数,默认定义:1。
5size返回基础数据中的元素数。
6values将系列作为ndarray返回。
7head()返回前n行。
8tail()返回最后n行。

参考案例:
返回系列的标签列表

import pandas as pd
import numpy as np
s = pd.Series(np.random.randn(4))
print(("The axes are:"))
print(s.axes)

DataFrame数据帧基本功能

编号属性或方法描述
1T转置行和列。
2axes返回一个列,行轴标签和列轴标签作为唯一的成员。
3dtypes返回此对象中的数据类型(dtypes)。
4empty如果NDFrame完全为空[无项目],则返回为True; 如果任何轴的长度为0。
5ndim轴/数组维度大小。
6shape返回表示DataFrame的维度的元组。
7sizeNDFrame中的元素数。
8valuesNDFrame的Numpy表示。
9head()返回开头前n行。
10tail()返回最后n行。

参考案例:
返回每列的数据类型

import pandas as pd
import numpy as np

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
df = pd.DataFrame(d)
print(("The data types of each column are:"))
print(df.dtypes)

结果:

The data types of each column are:
Age     int64
Name    object
Rating  float64
dtype: object

描述性统计信息的函数

编号函数描述
1count()非空观测数量
2sum()所有值之和
3mean()所有值的平均值
4median()所有值的中位数
5mode()值的模值
6std()值的标准偏差
7min()所有值中的最小值
8max()所有值中的最大值
9abs()绝对值
10prod()数组元素的乘积
11cumsum()累计总和
12cumprod()累计乘积

参考案例:
数据平均值

import pandas as pd
import numpy as np
#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack',
   'Lee','David','Gasper','Betina','Andres']),
   'Age':pd.Series([25,26,25,23,30,29,23,34,40,30,51,46]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}
df = pd.DataFrame(d)
print(df.mean())

结果:

Age       31.833333
Rating     3.743333
dtype: float64

数据汇总函数describe用法:

import pandas as pd
import numpy as np
#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack',
   'Lee','David','Gasper','Betina','Andres']),
   'Age':pd.Series([25,26,25,23,30,29,23,34,40,30,51,46]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}
#Create a DataFrame
df = pd.DataFrame(d)
print(df.describe())

结果:

               Age         Rating
count    12.000000      12.000000
mean     31.833333       3.743333
std       9.232682       0.661628
min      23.000000       2.560000
25%      25.000000       3.230000
50%      29.500000       3.790000
75%      35.500000       4.132500
max      51.000000       4.800000
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值