1.背景介绍
随着互联网、移动互联网、物联网等新型应用模式的发展,越来越多的人开始收集和处理海量数据,而这些数据的可视化成为一个重要的数据分析手段。在这个过程中,如何将数据转化成易于理解和分析的图表,成为数据科学家不可或缺的能力之一。但由于对图形技术、编程语言不熟悉,导致许多数据分析人员在此领域走得尘埃落地。
本文主要以最通用的数据可视化库——matplotlib和seaborn来进行教程,初步了解matplotlib的基本语法和功能,进而深入介绍seaborn的一些高级特性,并结合实例学习如何利用这些工具生成各种统计、绘图图表。
2.核心概念与联系
Matplotlib简介
Matplotlib是一个python 2D绘图库,它可以用来创建静态图形(static graphics)、信息图(infographics)、交互式图表(interactive plots),以及具有三维可视化效果的3D图形。Matplotlib能够轻松实现复杂的统计图表的制作,且支持不同的输出文件格式,包括PNG、PDF、SVG、EPS和PPTX。它的底层依赖关系较少,因此可以轻易地嵌入到其他项目中。
Matplotlib由两部分组成,其中figure表示整个图像,axes表示图像中的坐标轴,比如横轴x轴和纵轴y轴,其中pyplot模块提供了一种方便的接口,用于创建和管理Figure及Axes对象。每个Figure都有一个子图(Subplot)集合,其中的每一个Axes对象代表一个子图,可以同时包含不同类型的数据图例。例如,可以在同一个子图上绘制散点图(Scatter plot)