统计图形可视化

最新推荐文章于 2023-03-30 11:07:46 发布

转载最新推荐文章于 2023-03-30 11:07:46 发布 · 847 阅读

·

0

·

本文探讨了数据可视化中的关键概念，如统计图、数据变换、归一化及曲线拟合，阐述了数据采样的影响因素，并介绍了K-Means聚类与K-medoids的算法原理。此外，还讨论了不同倾斜方法在统计图表中的应用，以及Log尺度和尺度中断在数据展示中的优劣。

统计图可视化

数据变换

在这里插入图片描述

归一化

目的：
根据分布映射数据
颜色/尺寸/坐标位置编码
归一化区间：
[-1 , 1]
[0 , 1]

曲线拟合/光滑

目的：展示数据趋势
不同的拟合方式：
在这里插入图片描述

统计采样

从统计分布中选出的样本，用于近似原分布中的特征
影响采样的因素：
　　分布本身的特性
　　数据的测量精度
　　是否需要分析样本细节（样本精细度）
　　采样成本

K-Means聚类

K-means
　随机产生K个中心位置
　将每个数据点归为距离最近的中心位置所属的类
　根据新的类别划分重新计算中心位置
　回到第二步，直到满足一定约束

K-medoids – 改进
　中心位置必须在数据点所在位置上
　中心位置满足“到类内所有数据点的距离之和最小”

统计图表

中值斜率倾斜：
在这里插入图片描述
平均斜率倾斜：

平均方向倾斜：

在这里插入图片描述
横纵比倾斜：

多尺度45°倾斜

为不同的规模优化横纵比
方法：
　鉴别感兴趣数据的尺度
　生成特定规模的趋势线
　把这些线向45°倾斜
　过滤生成的横纵比
　
Log尺度：容易比较所有数据
尺度中断：很难跨越中断比较所有数据

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。