Pandas 数据统计描述性分析

1、加载数据

file = 'X:\\谭扬通\\python\\Excel\\2020年中国大学排名.xlsx'
data = pd.read_excel(file)
print(data.head(20))

2、修改索引

data.set_index('学校名称').head(20)

3、查看数据量

print(data.size)

4、排序

#降序
data.sort_values('总分',ascending=False).head(20)

#升序
data.sort_values('高端人才得分',ascending=True).head(10)

5、统计信息|均值

data['总分'].mean()

 6、统计信息|最大值

data['总分'].max()

7、统计信息|最小值

data['总分'].min()

8、统计信息|中位数

data['总分'].median()

9、统计信息|众数

data['高端人才得分'].mode()

10、统计信息|部分

data.agg({'总分':min,'高端人才得分':max,'师资规模与结构得分':'mean'})

11、统计信息|完整

data.describe()

12、统计信息|相关系数

data.corr()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值