双变量统计分析方法详解
1. 残差分析
在进行数据分析时,我们常常需要比较预测值与实际观测值之间的差异,这一过程就是残差分析。残差的统计信息对于评估模型拟合数据的质量至关重要。例如,如果残差呈现出明显的趋势,那就表明当前模型可能无法完全描述数据,此时可能需要使用更复杂的模型,如更高次的多项式模型。
理想情况下,残差应该是完全随机的,即服从均值为零的高斯分布。我们可以通过观察残差的直方图并使用卡方检验(χ² - test)来验证残差是否符合高斯分布。
以下是具体的操作步骤和代码示例:
clear
agedepth = load('agedepth_1.txt');
meters = agedepth(:,1);
age = agedepth(:,2);
p = polyfit(meters,age,1);
res = age - polyval(p,meters);
通过绘制残差图,如果没有发现明显的规律,那么说明使用直线模型拟合数据就足够了。
plot(meters,res,'o')
另外,还可以使用 stem 函数绘制残差的杆状图。
subplot(2,1,1)
plot(meters,age,'o'), hold on
plot(meters,p(1)*meters+p(2),'r'), hold off
subplot(2,1,
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



