一款有点高级的可视化神器!

本文介绍了Plotly_Express这一高级可视化库,它提供了丰富的图表类型和内置数据集,如柱状图、散点图、饼图、旭日图等,并且支持动态效果。只需简单API调用,即可创建精美图表。此外,Plotly_Express还内置了多种颜色面板和图形主题,方便定制视觉风格。

我是小z

可视化工具写过不少,今天给大家分享一个有点高级的可视化库——plotly_express

高级可视化神器Plotly_Express快速入门

Plotly_Express是新一代的高级可视化神器,它是plotly.py的高级封装,内置了大量实用、现代的绘图模板。

使用者只需要调用简单的API函数,便可快速地生成漂亮的动态可视化图表;同时其内置了很多的数据集,方便自行调用,快速模拟作图。

becbfe8e196a2a34b7f28ad7f2ef395d.png

安装

pip install plotly_express 命令可以安装plotly_express

pip install plotly_express

内置数据集

先导入相关库,进行查看数据集:

import pandas as pd
import numpy as np
import plotly_express as px  # 或 import plotly.express as px
GDP数据

记录的是不同国家历年GDP收入与人均寿命,包含的字段:

  • 国家country

  • 洲continent

  • 年份year

  • 平均寿命lifeExp

  • 人口数量pop

  • GDPgdpPercap

  • 国家简称iso_alpha

  • 国家编号iso_num

75deba1bd9678876d14c3c9655b1ef16.png
餐厅流水数据

餐厅的订单流水数据,包含字段:

  • 总账单费用bill

  • 小费tip

  • 顾客性别sex

  • 顾客是否抽烟smoker

  • 就餐日期day

  • 就餐时间time

  • 就餐人数size

d4ae01f08187220ffa46e99b75cc3796.png
鸢尾花数据集

著名的鸢尾花数据集,包含字段:

  • 萼片长sepal_length

  • 萼片宽sepal_width

  • 花瓣长petal_length

  • 花瓣宽petal_width

  • 花的种类species

  • 种类所属编号species_id

8df618526b228d1b926b87a9b107f668.png
风力数据

一份关于风力等级的数据:

  • 方向direction

  • 强度strength

  • 频率frequency

3b9d06f853d6a96891c29ab3db559cff.png
选举投票结果

该数据集记录的是2013年蒙特利尔市长选举投票结果,包含的主要字段:

  • 区域district

  • Coderre票数

  • Bergeron票数

  • Joly票数

  • 总票数total

  • 胜者winner

  • 结果result

  • 区编号district_id

3950e68bd82f192ce53095f924592af3.png
汽车共享可用性数据

该数据记录的是蒙特利尔一个区域中心附近的汽车共享服务的可用性,包含的字段:

  • 纬度centroid_lat

  • 经度centroid_lon

  • 汽车小时数car_hours

  • 高峰小时peak_hour

adf319bb57d5be040c82589c89a1d8ef.png
股票数据

内置的一份股票数据,包含字段:

  • 日期date

  • 6个公司名称:GOOG、AAPL、AMZN、FB、NFLX、MSFT

73f4230da4edfe3862bd91e6110869b1.png

内置颜色面板

plotly_express还内置了很多颜色面板,颜色任你选择,下面是各个主题下的部分截图:

卡通片主题
px.colors.carto.swatches()
189cf936c655f2e79ed7596697730fb3.png
CMOcean系列
px.colors.cmocean.swatches()
b5d3b611ba6afc72b5e1a3666e26abab.png
ColorBrewer2系列
px.colors.colorbrewer.swatches()
acd38ceb68a68f83e7b9872c75ed016c.png
周期性色调

适用于具有自然周期结构的连续数据

px.colors.cyclical.swatches()
c5fe6437b041f1eafbd6a0c2b418edb4.png
分散色标

适用于具有自然中点的连续数据

px.colors.diverging.swatches()
da4aae32317635df69f4098e295056f9.png
定性色标系列

适用于没有自然顺序的数据

px.colors.qualitative.swatches()
d0406dc942ee1d1a20145089332ae17c.png
image-20210325170234151
顺序色标系列

渐变的颜色系列,适用于大多数连续数据

px.colors.sequential.swatches()
ef6eb02da080d732c496a536e4605440.png
image-20210325170457557

作图

下面介绍使用Plotly_express绘制常见的图形,所有的图形在jupyter notebook中都是动态可视化的,本文中采用截图展示。

柱状图
# 指定选取国家:Switzerland

Switzerland  = gapminder[gapminder["country"] == "Switzerland"]
Switzerland   # 数据显示如下
8eaad571bf5d7e4c062ce2d8a137f7f9.png
px.bar(Switzerland,  # 上面指定的数据
       x="year",  # 横坐标
       y="pop",  # 纵坐标
       color="pop")  # 颜色取值

具体结果如下:

f7d499e0bcdd3addecfb398121b08560.png
散点图

先选取绘图需要的数据:

# 写法1
# gapminder_2002 = gapminder.query("year==2002")

# 写法2
gapminder_2002 = gapminder[gapminder["year"] == 2002]
gapminder_2002
11b0e7ff7cc20535193bcbfbbba3d910.png
px.scatter(gapminder_2002,   # 传入的数据集
           x="gdpPercap",  # 横坐标是人均GDP
           y="lifeExp",  # 纵坐标是平均寿命
           color="continent"  # 颜色取值:根据洲的值来取
          )
12af7a3cd8571a6a947617b73587374b.png
冒泡散点图
px.scatter(gapminder_2002   # 绘图DataFrame数据集
           ,x="gdpPercap"  # 横坐标
           ,y="lifeExp"  # 纵坐标
           ,color="continent"  # 区分颜色
           ,size="pop"   # 区分圆的大小
           ,size_max=60  # 散点大小
          )
5c106f5a372fedf32ab38f6c86a02ed0.png
散点矩阵图
px.scatter_matrix(iris,  # 传入绘图数据
                  dimensions=["sepal_width","sepal_length","petal_width","petal_length"],  # 维度设置
                  color="species")  # 颜色取值
458b2743df8bbcb034e4bf2cba4bc347.png
面积图
# area 图
px.area(gapminder,   # 绘图的数据集
        x="year",   # 横轴数据
        y="pop",  # 纵轴数据
        color="continent",  # 颜色取值
        line_group="country")  # 线型分组
d888c188e07817683db52bd1ca9e85be.png
股票趋势图
# FB公司股票趋势图
px.line(stock, x='date', y="FB")
cdfe0d5042d2a33f05aa6e0d31c974cb.png
饼图

1、我们使用小费tips数据,查看前5行数据:

96cc3cba2dfe7ad720ff7b9010b4493c.png

2、根据day分组,统计total_bill字段的和

18ea460798c3341ce97994ccfb7a988b.png

3、绘制饼图,自动显示每个day的占比

px.pie(total_bill_byday, # 绘图数据
       names="day",  # 每个组的名字
       values="total_bill"  # 组的取值
      )
bf02b93e8c6623c77052576828cd6d6c.png
旭日图
# 选取2002年数据
gapminder_2002 = gapminder[gapminder["year"] == 2002]

px.sunburst(gapminder_2002,   # 绘图数据
            path=['continent', 'country'],  # 指定路径:从洲到国家
            values='pop', # 数据大小:人口数
            color='lifeExp',  # 颜色
            hover_data=['iso_alpha'] # 显示数据
           )
dce1b3f02bdb81a5cc863bc4e32ecc79.png
漏斗图

漏斗图形在互联网的电商、用户分群等领域使用的比较广泛,自行模拟一个电商UV-付款转化的数据绘图:

data = dict(   # 创建原始数据
    number = [1000, 800, 400, 200, 100, 30],
    stage = ["UV", "搜索", "搜藏", "加购", "下单", "付款"]
)

# 传入数据和数轴
px.funnel(data, 
          x="number", 
          y="stage")
24ca7ef1d4d1145d2d1927be422f4f60.png

加入一个颜色参数color,改变每个阶段的颜色:

data = dict(   # 创建原始数据
    number = [1000, 800, 400, 200, 100, 30],
    stage = ["UV", "搜索", "搜藏", "加购", "下单", "付款"]
)

# 传入数据和数轴
px.funnel(data, 
          x="number", 
          y="stage",
          color="number"  # 颜色设置
         )
56f4a8422dbc70d5706f4c51c1480e6d.png
直方图
px.histogram(
    tips,  # 绘图数据
    x="sex",  # 指定两个数轴
    y="tip",
    histfunc="avg",  # 直方图函数:均值
    color="smoker",  # 颜色取值
    barmode="group",  # 柱状图模式
    facet_row="time",  # 横纵纵轴的字段设置
    facet_col="day",
    category_orders={"day":["Thur","Fri","Sat","Sun"],  # 分类
                     "time":["Lunch","Dinner"]})
5ffce192eac763a0179253f8f9b80441.png
联合分布图

多种图形的组合显示:

px.scatter(
    iris,
    x="sepal_width",
    y="sepal_length",
    color="species",
    marginal_x="histogram",
    marginal_y="rug")
936eec28a05855fdcac7fcae060a0ceb.png
箱型图
# notched=True显示连接处的锥形部分
px.box(tips,  # 数据集
       x="day",  # 横轴数据
       y="total_bill",  # 纵轴数据
       color="smoker",  # 颜色
       notched=True)  # 连接处的锥形部分显示出来
e20be8ff90251334fb1e5e172e0c4cc6.png
小提琴图
px.scatter(iris,  # 传入数据
           x="sepal_width",  # 设置XY轴
           y="sepal_length",
           color="species",  # 颜色取值
           marginal_y="violin",  # xy两表图形的设置:小提琴图和箱型图
           marginal_x="box",
           trendline="ols")  # 趋势线设置
63297e66064b8fb301a600540d6fe489.png
等高线图
px.density_contour(iris,  # 数据集
                   x="sepal_width",  # xy轴
                   y="sepal_length",
                   color="species"  # 颜色取值
                  )
993058c433875e31546731de741b3cb0.png

还可以绘制密度等值线图;

px.density_heatmap(iris,   # 传入数据
                   x="sepal_width",  # 两个轴的数据设置
                   y="sepal_length",
                   marginal_y="rug",  # 边缘图形设置
                   marginal_x="histogram"   # 在密度图的基础上,指定另外两种图形
                  )
966c9f4b97772d413004387e6d6d1aaa.png
密度热力图

数据的设置和密度等值图相同,只是选择的图形种类不同:

px.density_heatmap(   # 密度热力图
  iris,  
  x="sepal_width",
  y="sepal_length",
  marginal_y="rug",
  marginal_x="histogram"   
)
bc01869aa522890122842526a48a46d7.png
并行分类图
px.parallel_categories(
    tips,  # 传入数据
    color="size",  # 颜色取值
    color_continuous_scale=px.colors.sequential.Inferno # 颜色变化趋势
)
2cee5a75a529a31cb1205980e8fac013.png
3D散点图

使用的是选举结果数据集:

px.scatter_3d(
    election,  # 传入数据集
    x="Joly",  # 指定XYZ坐标轴的数据
    y="Coderre",  
    z="Bergeron",  
    color="winner",  # 颜色取值
    size="total",   # 大小取值
    hover_name="district_id",  # 指定颜色种类、大小和显示名称
    symbol="result",  # 右边的圆形和菱形
    color_discrete_map={"Joly":"blue",
                        "Bergeron":"green",
                        "Coderre":"red"}   # 改变默认颜色
)
a3df7b5d81c9ac7dc30f3cc4ad81ecac.png
3D线型图
px.line_3d(
  election,  # 绘图数据集
  x="Joly",  # 3个坐标轴
  y="Coderre",
  z="Bergeron",
  color="winner",  # 颜色和线型设置
  line_dash="winner"
)
2f0b3c8eae976a9f47dc7ee6244b4340.png
基于地图的图形

基于choropleth分布的地图:

px.choropleth(
  gapminder,  # 数据
  locations="iso_alpha",  # 简称
  color="lifeExp",  # 颜色取值
  hover_name="country",  # 悬停数据
  animation_frame="year",  # 播放按钮设置
  color_continuous_scale=px.colors.sequential.Plasma,  # 颜色变化取值
  projection="natural earth"  # 使用的地图设置
)
aed525d1fae8d39f8f296d29674df710.png

基于line_geo线型地图:

px.line_geo(
  gapminder_2002,
  locations="iso_alpha",
  color="continent",
  projection="orthographic")
e30a38b2810b3bafe2f1254c3ff31005.png
矩阵式树状结构图

矩阵式树状结构图是一种用于分层数据的复杂、基于区域的数据展示图形:

# 选取2002年数据
gapminder_2002 = gapminder[gapminder["year"] == 2002]

px.treemap(
    gapminder_2002, # 数据
    path=[px.Constant('world'), 'continent', 'country'],   # 绘图路径:world---continent---country
    values='pop',  # 数据取值
    color='pop',   # 颜色取值
    hover_data=['iso_alpha'])  # 显示数据:国家简称
2e947caa2d51a90abad6ed3838c8be01.png
散点极坐标图
px.scatter_polar(  # 散点极坐标
    wind,  #  数据集
    r="frequency",  # 半径
    theta="direction",   # 角度
    color="strength",  # 颜色
    symbol="strength",  # 符号
    color_discrete_sequence=px.colors.sequential.Plasma_r)  # 颜色
f5ec9147fe3a6ca99d7cb2a78e7ad90f.png
线性极坐标图
px.line_polar(  # 线性极坐标
    wind,  # 数据集
    r="frequency",  # 半径
    theta="direction",  # 角度
    color="strength",  # 颜色
    line_close=True,  # 线性闭合
    color_discrete_sequence=px.colors.sequential.Plasma_r)  # 颜色
00b7be8c03c9cdadef5cffbed047fb86.png
柱状极坐标图
px.bar_polar(   # 柱状图极坐标图
    wind,   # 数据集
    r="frequency",   # 半径
    theta="direction",  # 角度
    color="strength",  # 颜色
    template="plotly_dark",  # 主题
    color_discrete_sequence=px.colors.sequential.Plasma_r)  # 颜色
91e46cc67a52089fd1902c13222cc99a.png

内置主题

Plotly_Express内置了3种主题可供选择:

  • plotly

  • plotly_white

  • plotly_dark

px.scatter(gapminder_2002,   # 传入的数据集
           x="gdpPercap",  # 横坐标是人均GDP
           y="lifeExp",  # 纵坐标是平均寿命
           color="continent",  # 颜色取值:根据洲的值来取
           
           template="plotly"  # 分别主题设置为:plotly、plotly_dark
          )
1585ebbede151f26554b2c6e980256af.png3c182b51dcb18795abf121b65f9331c9.pngda845a004969ab4d710c6ace5c281cf1.png

总结

本文详细介绍了一个新的高级可视化库Plotly_Express,从其简介、安装、内置的颜色面板、主题到各种图形的绘制。

这个库最大的特点:代码量非常少,图形种类全,基本上一行代码就能绘制出非常精美的动态可视化图形

以上。

8fa9f26c113e71fd0dd683a6a74969e5.gif

●Graveyard分析模型是真的牛X!
●品牌知名度分析实例
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值