单变量统计与理论分布详解
1. 单变量统计基础
在单变量统计中,峰度(kurtosis)是一个重要的概念。峰度反映了分布在均值附近的顶部形态和尾部的宽窄情况。较高的峰度意味着分布在均值附近有一个尖锐的顶部,这通常是由罕见的极端偏差导致的;而较低的峰度则表示分布较为平坦,顶部较宽,这是由频繁的中等偏差引起的。对于正态分布而言,其峰度为 3。在一些定义中,会从上述计算得到的峰度值中减去 3,从而使正态分布的峰度为 0。
2. 经验分布示例
2.1 湖泊沉积物有机质含量数据
为了更好地理解单变量统计,我们以湖泊沉积物有机质含量的数据为例进行分析。这些数据存储在 organicmatter_one.txt 文件中,数据以重量百分比(wt%)的形式记录了湖泊沉积物中的有机质含量。
以下是加载和初步展示数据的步骤:
clear
corg = load('organicmatter_one.txt');
plot(corg,zeros(1,length(corg)),'o')
通过这个图形,我们可以看到数据的一些特征。样本中的有机碳含量范围在 9% 到 15% 之间,大部分数据集中在 12% 到 13% 之间,低于 10% 和高于 14% 的值较为罕见。
然而,直方图是展示单变量数据更为便捷的方式。我们可以使用 hist 函数来创建直方图:
hist(corg)
超级会员免费看
订阅专栏 解锁全文
1008

被折叠的 条评论
为什么被折叠?



