7、数据可视化:从基础到实践

数据可视化:从基础到实践

在数据分析中,可视化是理解和传达数据信息的重要手段。不同类型的数据需要不同的可视化方法,下面将详细介绍各种数据可视化的工具和技巧。

1. 核密度估计与数据范围

在评估证据价值时,我们可能未观察到数据的整个范围,这一点至关重要。核密度估计对带宽的选择较为敏感,不同的带宽可能会导致不同的估计结果。

2. 箱线图

箱线图(也称为盒须图)是快速比较分组数据在连续变量方面的有效工具。它能直观展示一组汇总统计信息。
- 箱线图的构成
- 箱体从下四分位数(LQ)绘制到上四分位数(UQ)。
- 箱体内的一条线表示中位数。
- 须线从上下四分位数延伸约 1.5 倍的四分位距(IQR),然后“回缩”到最近的数据点。
- 外部点是位于须线范围之外的点,它们可能是异常值,但不一定是。
- 数据对称性判断 :如果须线长度大致相等且中位数线大致位于箱体中间,则数据对称;如果一条须线很长而另一条很短,则数据偏斜。
- 适用情况 :箱线图适合快速了解分组数据的位置和分布情况,但当每组观察值较少(少于 20 个)时,其效果不佳。

graph LR
    A[箱线图] --> B[箱体(LQ - UQ)]
    A --> C[中位数线]
    A --> D[须线(约 1.5 * IQR)]
    A --> E[外部点]
    B --> F[下四分位数
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值