初学pandas的时候,对数据的一些参数是记不太得的。所以就来记录下这些输出的意义。
在吴恩达的机器学习作业中,几乎每个作业的步骤都是首先用pandas读取数据,然后使用describe()方法进行查看
就会得到如下:

那么我门来看看这个表达了什么:
由标题我们只看exam1,exam2代表两个科目.来解释一下
count:总共有100条记录相当于100个人参加这两次考试
mean:就是除去缺考的(等于空值)之外的平均值
std:就是成绩的方差
min:就是成绩最差的人
25%: 表示25%分位数 就是成绩从低到高排序,在第百分之25的时候的人的成绩
50%:就是成绩刚好中间的分数。等于中位数
75%:跟25的解释一样。
max:第一名的分数,就是最大值
Pandas数据描述方法详解
本文详细解析了使用Pandas库中的describe()方法对数据集进行统计描述的过程,包括count、mean、std、min、25%分位数、50%分位数(中位数)、75%分位数及max等关键统计指标的含义,帮助初学者快速理解并应用。
1783





