单变量分布可视化教程
在数据分析中,理解单变量的分布情况至关重要。本文将介绍多种用于可视化单变量分布的方法,包括直方图、密度图、箱线图、小提琴图和 Q - Q 图,并给出相应的代码示例。
1. 直方图(Histograms)
直方图是一种常用的可视化工具,用于展示变量的分布情况。以下是使用不同包创建直方图的方法:
- Gadfly 包 :
# 创建一个新的 Pluto 笔记本,加载 Gadfly 和 Iris 数据集
# 生成花瓣长度的直方图
plot(iris, x=:PetalLength, Geom.histogram)
- Makie 生态系统 :
# 创建一个新的 Pluto 笔记本,加载 CairoMakie、AlgebraOfGraphics 和 Iris 数据集
hist(iris.PetalLength)
- AlgebraOfGraphics 包 :
data(iris) * mapping(:PetalLength) * visual(Hist) |> draw
超级会员免费看
订阅专栏 解锁全文
1795

被折叠的 条评论
为什么被折叠?



