pandas的describe()的输出解释

本文详细解析了使用Pandas库中的describe()方法对数据集进行统计描述的过程,包括count、mean、std、min、25%分位数、50%分位数(中位数)、75%分位数及max等关键统计指标的含义,帮助初学者快速理解并应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

初学pandas的时候,对数据的一些参数是记不太得的。所以就来记录下这些输出的意义。
在吴恩达的机器学习作业中,几乎每个作业的步骤都是首先用pandas读取数据,然后使用describe()方法进行查看
 就会得到如下:

在这里插入图片描述
那么我门来看看这个表达了什么:
由标题我们只看exam1,exam2代表两个科目.来解释一下
count:总共有100条记录相当于100个人参加这两次考试
mean:就是除去缺考的(等于空值)之外的平均值
std:就是成绩的方差
min:就是成绩最差的人
25%: 表示25%分位数 就是成绩从低到高排序,在第百分之25的时候的人的成绩
50%:就是成绩刚好中间的分数。等于中位数
75%:跟25的解释一样。
max:第一名的分数,就是最大值

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值