初学pandas的时候,对数据的一些参数是记不太得的。所以就来记录下这些输出的意义。
在吴恩达的机器学习作业中,几乎每个作业的步骤都是首先用pandas读取数据,然后使用describe()方法进行查看
就会得到如下:
那么我门来看看这个表达了什么:
由标题我们只看exam1,exam2代表两个科目.来解释一下
count:总共有100条记录相当于100个人参加这两次考试
mean:就是除去缺考的(等于空值)之外的平均值
std:就是成绩的方差
min:就是成绩最差的人
25%: 表示25%分位数 就是成绩从低到高排序,在第百分之25的时候的人的成绩
50%:就是成绩刚好中间的分数。等于中位数
75%:跟25的解释一样。
max:第一名的分数,就是最大值