pandas 常用统计方法

本文介绍了Pandas库中常用的数据统计方法,包括均值、中位数等,并通过实例展示了如何使用这些方法进行数据分析。文章还详细解释了处理缺失值的不同选项。

统计方法

pandas 对象有一些统计方法。它们大部分都属于约简和汇总统计,用于从 Series 中提取单个值,或从 DataFrame 的行或列中提取一个 Series。

比如 DataFrame.mean(axis=0,skipna=True) 方法,当数据集中存在 NA 值时,这些值会被简单跳过,除非整个切片(行或列)全是 NA,如果不想这样,则可以通过 skipna=False 来禁用此功能:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
>>> df
    one  two
1.40  NaN
7.10 -4.5
c   NaN  NaN
0.75 -1.3
 
[4 rows x 2 columns]
>>> df.mean()
one    3.083333
two   -2.900000
dtype: float64
>>> df.mean(axis=1)
a    1.400
b    1.300
c      NaN
d   -0.275
dtype: float64
>>> df.mean(axis=1,skipna=False)
a      NaN
b    1.300
c      NaN
d   -0.275
dtype: float64

其他常用的统计方法有:

######################## ******************************************
count 非 NA 值的数量
describe 针对 Series 或 DF 的列计算汇总统计
min , max 最小值和最大值
argmin , argmax 最小值和最大值的索引位置(整数)
idxmin , idxmax 最小值和最大值的索引值
quantile 样本分位数(0 到 1)
sum 求和
mean 均值
median 中位数
mad 根据均值计算平均绝对离差
var 方差
std 标准差
skew 样本值的偏度(三阶矩)
kurt 样本值的峰度(四阶矩)
cumsum 样本值的累计和
cummin , cummax 样本值的累计最大值和累计最小值
cumprod 样本值的累计积
diff 计算一阶差分(对时间序列很有用)
pct_change 计算百分数变化
当然可以!Pandas是一个强大的数据分析工具,提供了许多常用的方法来处理和操作数据。以下是一些常用Pandas方法: 1. 读取数据: - `read_csv()`:从CSV文件中读取数据。 - `read_excel()`:从Excel文件中读取数据。 - `read_sql()`:从SQL数据库中读取数据。 2. 数据预览: - `head()`:查看数据的前几行。 - `tail()`:查看数据的后几行。 - `info()`:查看数据的基本信息,如列名、数据类型等。 - `describe()`:查看数据的统计信息,如均值、标准差等。 3. 数据选择和过滤: - `loc[]`:通过标签选择行和列。 - `iloc[]`:通过位置选择行和列。 - `[]`:通过列名选择列。 4. 数据清洗和处理: - `dropna()`:删除包含缺失值的行或列。 - `fillna()`:填充缺失值。 - `replace()`:替换特定值。 - `duplicated()`:检测重复值。 - `drop_duplicates()`:删除重复值。 5. 数据排序和排名: - `sort_values()`:按照指定列的值进行排序。 - `rank()`:计算每个元素的排名。 6. 数据分组和聚合: - `groupby()`:按照指定列进行分组。 - `concat()`:按照指定轴将多个DataFrame合并。 - `merge()`:根据指定的列将两个DataFrame连接。 8. 数据可视化: - `plot()`:绘制数据的折线图、柱状图等。 - `hist()`:绘制数据的直方图。 - `scatter()`:绘制数据的散点图。 这些只是Pandas中的一部分常用方法,还有很多其他功能强大的方法可以用于数据处理和分析。如果你有具体的问题或者需要了解更多方法,请告诉我!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值