Pandas - 数据统计描述性分析

该博客介绍了如何使用Pandas库对2020年中国大学排名数据进行操作,包括读取Excel文件,设置“学校名称”为索引,查看数据量,按总分和高端人才得分排序,查找各项得分最高学校,以及计算总分列的均值、中位数和众数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.在Pandas中读入2020年中国大学排名.xlsx,并显示前五行。

import pandas as pd
df = pd.read_excel("2020年中国大学排名.xlsx")
df.head(5)


2.修改索引为 “学校名称”列,数据已经按照降序排列,让“学校”当索引会更好一点。

df = df.set_index("学校名称")
print(df.head(10))

3.查看数据量,也就是数据框的 行 * 列,总共单元格的数量。

df.size


4.将数据按照总分升序排列,并展示前20个学校,备注:也就是看倒数20名啦

df = df.sort_values(by='总分')
df.head(20)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值