4、探索性数据分析与概率理论基础

探索性数据分析与概率理论基础

1. 探索性数据分析实践

在数据分析中,探索性数据分析(Exploratory Data Analysis,EDA)是至关重要的一步。它能帮助我们了解数据的特征和分布,为后续的分析和建模提供基础。

1.1 百分位数计算

百分位数是一种用于描述数据分布的统计量。例如,我们可以计算鸢尾花数据集不同品种花瓣长度的 90% 百分位数。以下是具体的 Python 代码:

import numpy as np
# 假设 iris_setosa、iris_virginica、iris_versicolor 是已经加载好的鸢尾花数据集的不同品种数据
print("\n 90th Percentiles:")
print(np.percentile(iris_setosa["petal_length"], 90))
print(np.percentile(iris_virginica["petal_length"], 90))
print(np.percentile(iris_versicolor["petal_length"], 90))

运行上述代码,可能会得到类似以下的结果:

90th Percentiles:
1.7
6.3100000000000005
4.8
1.2 分位数

分位数是将数据按从小到大的顺序排列后,将其划分为四个等份的数值。具体来说:
- 第一分位数(Q1):最低的 25% 的数值。
- 第二分位数:介于

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值