【比较与排序类可视化图像】

四类主要的可视化视图

比较:比较数据间各类别的关系,或者是它们随着时间的变化趋势,比如折线图;

联系:查看两个或两个以上变量之间的关系,比如散点图;

构成:每个部分占整体的百分比,或者是随着时间的百分比变化,比如饼图;

分布:关注单个变量,或者多个变量的分布情况,比如直方图。

单变量可视化视图:

一次值关注一个变量。如我们一次只关注身高变量,来看身高的取值分布,而暂时忽略其他变量。

多变量可视化视图:

可以让一张图同时查看两个以上的变量,比如“身高”和“年龄”,你可以理解是同一个人的两个参数,这样在同一张图中可以看到每个人的“身高”和“年龄”的取值,从而分析出这两个变量之前是否存在某种联系。

离散变量和连续变量:

离散变量是指其数值只能用自然数或整数单位计算的则为离散变量. 例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得. 反之,在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值.

针对离散变量我们可以使用常见的条形图饼图完成数据的可视化工作,那么,针对数值型变量,我们也有很多可视化的方法,例如箱线图、直方图、折线图、面积图、散点图等等。

散点图

散点图是一种用于展示两个变量之间关系的图形表示。它通过在平面上绘制一系列点,其中每个点的坐标由两个变量的值决定,从而直观地表现出这两个变量之间的相关性。
概念
定义:散点图由一组点组成,横坐标通常代表一个变量,纵坐标代表另一个变量,每个点的位置反映了这两个变量的取值关系。
用途:散点图可以用于探索数据集中的趋势、模式和潜在关系,比如正相关、负相关或无相关性等。
优势
1.直观性:能够快速向用户展示变量之间的关系,易于理解和传达。
2.发现趋势:有助于识别线性或非线性的关系模式。
3.离群点识别:能够有效地显示数据中的异常值,帮助后续分析。
4.多维度展示:可通过引入第三个变量(如不同颜色或点大小)来增加信息维度,使得散点图更具表现力。
下面是我使用python中的matpiotlib和seaborn工具包进行的示范:
1.引入工具包,Matplotlib的pyplot包

import matplotlib.pyplot as plt

在工具包引用后,画散点图,需要使用 plt.scatter(x, y, marker=None) 函数。x、y 是坐标,marker 代表了标记的符号。比如“x”、“>”或者“o”。选择不同的 marker,呈现出来的符号样式也会不同(就是以指定的符号当成点画图)。
或使用工具包seaborn

import seaborn as sns

在引用 seaborn 工具包之后,就可以使用 seaborn 工具包的函数了。如果想要做散点图,可以直接使用 sns.jointplot(x, y, data=None, kind=‘scatter’) 函数。其中 x、y 是 data 中的下标。data 就是我们要传入的数据,一般是 DataFrame 类型。kind 这类我们取 scatter,代表散点的意思。不同的 kind 代表不同的视图绘制方式。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# 数据准备
N = 1000
x = np.random.randn(N)
y = np.random.randn(N)
# 用 Matplotlib 画散点图
plt.scatter(x,y,marker="x")
plt.show()
#用seaborn画图
df=pd.DataFrame({'x':x,'y':y})
sns.joinplot(x='x',y='y',data=df,kind='scatter',marker='x')
#sns还是要借助pyplot来打印图的 其自身无show方法
plt.show    

运行结果:
seaborn:

在这里插入图片描述
Matplotlib:
在这里插入图片描述

折线图:

折线图可以用来表示数据随着时间变化的趋势。</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值