11、双变量统计分析方法详解

双变量统计分析方法详解

1. 残差分析

在进行数据分析时,我们常常需要比较预测值与实际观测值之间的差异,这一过程就是残差分析。残差的统计信息对于评估模型拟合数据的质量至关重要。例如,如果残差呈现出明显的趋势,那就表明当前模型可能无法完全描述数据,此时可能需要使用更复杂的模型,如更高次的多项式模型。

理想情况下,残差应该是完全随机的,即服从均值为零的高斯分布。我们可以通过观察残差的直方图并使用卡方检验(χ² - test)来验证残差是否符合高斯分布。

以下是具体的操作步骤和代码示例:

clear
agedepth = load('agedepth_1.txt');
meters = agedepth(:,1);
age = agedepth(:,2);
p = polyfit(meters,age,1);
res = age - polyval(p,meters);

通过绘制残差图,如果没有发现明显的规律,那么说明使用直线模型拟合数据就足够了。

plot(meters,res,'o')

另外,还可以使用 stem 函数绘制残差的杆状图。

subplot(2,1,1)
plot(meters,age,'o'), hold on
plot(meters,p(1)*meters+p(2),'r'), hold off
subplot(2,1,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值