数据可视化之水平条形图(原理+Python代码)

本文介绍了如何使用Python绘制水平条形图,以展示计算机领域发表论文数量排名前10的作者。通过条形图的长短,揭示各作者之间的数量差异,表明在国际学术界中国人的影响力。代码实现部分详细解释了绘制过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据来源于天池赛题:零基础入门数据分析-学术前沿趋势分析 ,地址:https://tianchi.aliyun.com/competition/entrance/531866/information

一、原理介绍

条形图是一种常见的基本统计图形,用于展示分类变量各个类别的数量。条形图又可以分为竖直条形图、水平条形图、堆叠条形图等。其中,水平条形图是一种将条形横向放置的条形图,通过比较不同类别条形的长短,可以直观地看出各类别数量上的差异。

这里通过绘制水平条形图,来展示计算机领域发表论文数量排名top10的作者。

二、代码实现

#加载常用模块
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings("ignore") #过滤掉警告的意思
from pyforest import *
#读入数据
data=pd.read_csv("F:/data/authors_names.csv")
#查看数据前五行
data.head()
0
0Pal Mahesh
1Mokhov Serguei A. for the MARF R&D Group
2Sinclair Stephen for the MARF R&D Group
3Clément Ian for the MARF R&D Group
4Nicolacopoulos Dimitrios for the MARF R&D Group
a=data['0'].value_counts() #对分类变量的类别进行计数
# 根据作者频率绘制直方图
plt.figure(figsize=(10, 6)) #设置画布大小
a.head(10).plot(kind='barh',color='r')   
#head(10)指定显示数量前10的类别,kind='barh'设定条形图的种类为水平条形图,color='r'设置图片颜色为红色

# 修改图配置
names = a.index.values[:10] #在图片中加上类别名称
_ = plt.yticks(range(0, len(names)), names)
plt.ylabel('Author')  #设置y轴标签
plt.xlabel('Count')  #设置x轴标签

在这里插入图片描述

三、结果解释

从水平条形图中可以看出,叫Tao Dacheng的作者发文数量最多,为50篇,远领先于其他作者。同时可以发现,发文量前10的作者中,大多都是中文名字,这可以说明中国人在国际学术界的影响力了。

相关阅读

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值