1、加载数据
file = 'X:\\谭扬通\\python\\Excel\\2020年中国大学排名.xlsx'
data = pd.read_excel(file)
print(data.head(20))
2、修改索引
data.set_index('学校名称').head(20)
3、查看数据量
print(data.size)
4、排序
#降序
data.sort_values('总分',ascending=False).head(20)
#升序
data.sort_values('高端人才得分',ascending=True).head(10)
5、统计信息|均值
data['总分'].mean()
6、统计信息|最大值
data['总分'].max()
7、统计信息|最小值
data['总分'].min()
8、统计信息|中位数
data['总分'].median()
9、统计信息|众数
data['高端人才得分'].mode()
10、统计信息|部分
data.agg({'总分':min,'高端人才得分':max,'师资规模与结构得分':'mean'})
11、统计信息|完整
data.describe()
12、统计信息|相关系数
data.corr()