双变量统计分析方法详解
1. 双变量统计基础
在双变量统计中,我们常常会关注两个变量之间的关系。以相关系数为例,大部分 rhos1000 的值落在0.92到0.98的区间内。由于重采样数据集的相关系数呈现明显的高斯分布,我们可以用其均值作为真实相关系数的良好估计。以下是计算均值的代码:
mean(rhos1000(:,2))
计算结果为0.9562,这个值与之前得到的 r = 0.9567 相近,这让我们对结果的有效性更有信心。不过,在年龄 - 深度数据的自举估计相关性分布中,由于上限固定为1,分布会出现偏斜。但自举法仍然是评估双变量分析中皮尔逊相关系数可靠性的重要工具。
2. 经典线性回归分析与预测
线性回归为描述两个变量 x 和 y 之间的关系提供了另一种方式。皮尔逊相关系数只能粗略衡量线性趋势,而通过回归分析得到的线性模型可以在数据范围内为任意给定的 x 值预测 y 值。对线性模型进行显著性统计检验,能让我们了解这些预测的准确性。
经典回归假设 y 对 x 做出响应,且数据集中的所有离散都体现在 y 值上。这意味着 x 是独立变量、回归变量或预测变量,其值由实验者定义,通常被认为没有误差。例如,从粘土样本所在沉积岩芯中的位置
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



