33种经典图表类型总结,轻松玩转数据可视化

导读:随着时代的发展,越来越多的数据量堆积,然而这些密密麻麻的数据的可读性较差并且毫无重点,而数据可视化更加直观有意义,更能帮助数据更易被人们理解和接受。


因此运用恰当的图表实现数据可视化非常重要,本文归结图表的特点,汇总出一张思维导图,帮助大家更快地选择展现数据特点的图表类型。


640?wx_fmt=png

▲图表类型-思维指南(点击可放大)


接下来我将依次介绍常用图表类型,分析其适用场景和局限,从而帮助大家通过图表更加直观的传递所表达的信息。


1. 柱状图


640?wx_fmt=other

▲柱状图


展示多个分类的数据变化和同类别各变量之间的比较情况。


  • 适用:对比分类数据。

  • 局限:分类过多则无法展示数据特点。


相似图表:


  1. 堆积柱状图。比较同类别各变量和不同类别变量总和差异。

  2. 百分比堆积柱状图。适合展示同类别的每个变量的比例。


2. 条形图


640?wx_fmt=other

▲条形图


类似柱状图,只不过两根轴对调了一下。


  • 适用:类别名称过长,将有大量空白位置标示每个类别的名称。

  • 局限:分类过多则无法展示数据特点 。


相似图表:


  1. 堆积条形图。比较同类别各变量和不同类别变量总和差异。

  2. 百分比堆积条形图。适合展示同类别的每个变量的比例。

  3. 双向柱状图。比较同类别的正反向数值差异。


3. 折线图


640?wx_fmt=other

▲折线图


展示数据随时间或有序类别的波动情况的趋势变化。


  • 适用:有序的类别,比如时间。

  • 局限:无序的类别无法展示数据特点。


相似图表:


  1. 面积图。用面积展示数值大小。展示数量随时间变化的趋势。

  2. 堆积面积图。同类别各变量和不同类别变量总和差异。

  3. 百分比堆积面积图。比较同类别的各个变量的比例差异。


4. 柱线图


640?wx_fmt=png

▲柱线图[1]


结合柱状图和折线图在同一个图表展现数据。


  • 适用:要同时展现两个项目数据的特点。

  • 局限:有柱状图和折线图两者的缺陷。


5. 散点图


640?wx_fmt=jpeg

▲散点图


用于发现各变量之间的关系。


  • 适用:存在大量数据点,结果更精准,比如回归分析。

  • 局限:数据量小的时候会比较混乱。


相似图表:


  • 气泡图。用气泡代替散点图的数值点,面积大小代表数值大小。


6. 饼图


640?wx_fmt=jpeg

▲饼图


用来展示各类别占比,比如男女比例。


  • 适用:了解数据的分布情况。

  • 缺陷:分类过多,则扇形越小,无法展现图表。

相似图表:


  1. 环形图。挖空的饼图,中间区域可以展现数据或者文本信息。

  2. 玫瑰饼图。对比不同类别的数值大小。

  3. 旭日图。展示父子层级的不同类别数据的占比。


7. 地图


640?wx_fmt=other

▲地图


用颜色的深浅来展示区域范围的数值大小。


  • 适合:展现呈面状但属分散分布的数据,比如人口密度等。

  • 局限:数据分布和地理区域大小的不对称。通常大量数据会集中在地理区域范围小的人口密集区,容易造成用户对数据的误解。


相似图表:


  1. 气泡地图。用气泡大小展现数据量大小。

  2. 点状地图。用描点展现数据在区域的分布情况。

  3. 轨迹地图。展现运动轨迹。


8. 热力图


640?wx_fmt=jpeg

▲热力图[2]


以特殊高亮的形式显示访客热衷的页面区域和访客所在的地理区域的图示。


  • 适合:可以直观清楚地看到页面上每一个区域的访客兴趣焦点。

  • 局限:不适用于数值字段是汇总值,需要连续数值数据分布。


9. 矩形树图


640?wx_fmt=jpeg

▲矩形树图[3]


展现同一层级的不同分类的占比情况,还可以同一个分类下子级的占比情况,比如商品品类等。


  • 适用:展示父子层级占比的树形数据。

  • 缺陷:不适合展现不同层级的数据,比如组织架构图,每个分类不适合放在一起看占比情况。


10. 指标卡


640?wx_fmt=jpeg

▲指标卡[4]


突出显示一两个关键的数据结果,比如同比环比。


  • 适合:展示最终结果和关键数据。

  • 缺陷:没有分类对比,只展示单一数据。


11. 词云


640?wx_fmt=jpeg

▲词云[5]


展现文本信息,对出现频率较高的“关键词”予以视觉上的突出,比如用户画像的标签。


  • 适合:在大量文本中提取关键词。

  • 局限:不适用于数据太少或数据区分度不大的文本。


12. 仪表盘


640?wx_fmt=jpeg

▲仪表盘


展现某个指标的完成情况。


  • 适合:展示项目进度。

  • 局限:只适合展现数据的累计情况,不适用于数据的分布特征等。


13. 雷达图


640?

▲雷达图[6]


将多个分类的数据量映射到坐标轴上,对比某项目不同属性的特点。


  • 适用:了解同类别的不同属性的综合情况,以及比较不同类别的相同属性差异。

  • 局限:分类过多或变量过多,会比较混乱。


14. 漏斗图


640?wx_fmt=png

▲漏斗图[7]


用梯形面积表示某个环节业务量与上一个环节之间的差异。


  • 适用:有固定流程并且环节较多的分析,可以直观地显示转化率和流失率。

  • 局限:无序的类别或者没有流程关系的变量。


15. 瀑布图


640?wx_fmt=jpeg

▲瀑布图


采用绝对值与相对值结合的方式,展示各成分分布构成情况,比如各项生活开支的占比情况。


  • 适合:展示数据的累计变化过程。

  • 局限:各类别数据差别太大则难以比较。


16. 桑葚图


640?wx_fmt=jpeg

▲桑葚图


一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,起始流量总和始终与结束流量总和保持平衡。比如能量流动等。


  • 适合:用来表示数据的流向。

  • 局限:不适用于边的起始流量和结束流量不同的场景。比如使用手机的品牌变化。

相似图表:


  • 和弦图。展现矩阵中数据间相互关系和流量变化。数据节点如果过多则不适用。


17. 箱线图


640?wx_fmt=jpeg

▲箱线图


是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法。


  • 适用:用来展示一组数据分散情况,特别用于对几个样本的比较。

  • 局限:对于大数据量,反应的形状信息更加模糊。

————————————————

作者:安琪Angela(已获授权);
来源:
https://www.jianshu.com/p/28c4b43c396d;

版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。

关联阅读

原创系列文章:

1:从0开始搭建自己的数据运营指标体系(概括篇)

2 :从0开始搭建自己的数据运营指标体系(定位篇)

3 :从0开始搭建自己的数据运营体系(业务理解篇)

4 :数据指标的构建流程与逻辑

5 :系列 :从数据指标到数据运营指标体系

6:   实战 :为自己的公号搭建一个数据运营指标体系

7:  从0开始搭建自己的数据运营指标体系(运营活动分析)

数据运营 关联文章阅读:  

运营入门,从0到1搭建数据分析知识体系    

推荐 :数据分析师与运营协作的9个好习惯

干货 :手把手教你搭建数据化用户运营体系

推荐 :最用心的运营数据指标解读

干货 : 如何构建数据运营指标体系

从零开始,构建数据化运营体系

干货 :解读产品、运营和数据三个基友关系

干货 :从0到1搭建数据运营体系

数据分析、数据产品 关联文章阅读:

干货 :数据分析团队的搭建和思考

关于用户画像那些事,看这一文章就够了

数据分析师必需具备的10种分析思维。

如何构建大数据层级体系,看这一文章就够了

干货 : 聚焦于用户行为分析的数据产品

如何构建大数据层级体系,看这一文章就够了

80%的运营注定了打杂?因为你没有搭建出一套有效的用户运营体系

从底层到应用,那些数据人的必备技能

读懂用户运营体系:用户分层和分群

做运营必须掌握的数据分析思维,你还敢说不会做数据分析

合作请加qq:365242293  


更多相关知识请回复:“ 月光宝盒 ”;

数据分析(ID : ecshujufenxi )互联网科技与数据圈自己的微信,也是WeMedia自媒体联盟成员之一,WeMedia联盟覆盖5000万人群。

640?wx_fmt=png

学习 Pandas 的使用技巧,从入门到进阶可以分为几个阶段,涵盖基础操作、数据处理与分析、性能优化等方面。 ### 数据结构与基本操作 Pandas 主要提供两种核心数据结构:`Series` 和 `DataFrame`。`Series` 是一维的数组结构,而 `DataFrame` 则是二维表格型的数据结构,非常适合用来处理和分析结构化的数据[^4]。掌握这些数据结构的基本操作,如索引、切片、选择和过滤数据等,是学习 Pandas 的第一步。 例如,创建一个简单的 `DataFrame`: ```python import pandas as pd data = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35] } df = pd.DataFrame(data) print(df) ``` ### 数据导入与导出 Pandas 支持多种格式的数据文件读取和写入,包括 CSV、Excel、SQL 数据库等。这使得它可以轻松地与其他系统集成,并作为数据处理的一个重要环节[^1]。例如,从 CSV 文件中读取数据: ```python df = pd.read_csv('path/to/file.csv') ``` ### 数据清洗与预处理 在数据分析之前,通常需要对原始数据进行清洗和预处理。这包括处理缺失值、删除重复项、类型转换等。Pandas 提供了多种方法来帮助完成这些任务,比如 `dropna()` 删除含有缺失值的行或列,`fillna()` 填充缺失值,以及 `astype()` 转换数据类型等。 ### 数据转换与特征工程 除了基本的数据清洗外,Pandas 还支持复杂的数据转换操作,如应用函数、映射值、分箱离散化等。这对于构建机器学习模型时的特征工程非常有用。 ### 数据聚合与分组 利用 `groupby()` 方法可以按一个或多个列对数据进行分组,并且可以在每个分组上执行聚合函数,从而得到汇总统计信息。这是探索性数据分析中的一个重要工具。 ### 时间序列分析 对于时间序列数据,Pandas 也提供了专门的支持,包括日期范围生成、频率转换、时间偏移等功能。这对于金融分析、经济预测等领域尤为重要。 ### 性能优化技巧 当处理大规模数据集时,了解如何提高代码效率变得至关重要。一些最佳实践包括避免使用循环而是采用向量化运算、合理使用内存(如通过指定合适的 dtypes)、以及利用 Categorical 类型减少存储空间等[^2]。 ### 可视化 虽然 Pandas 自身并不专注于可视化,但它集成了 Matplotlib 库的功能,允许直接调用绘图函数来快速生成图表,辅助数据洞察。 通过以上各个层次的学习与实践,能够逐步建立起扎实的 Pandas 使用技能,进而有效提升个人在数据科学领域的竞争力。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值