数理统计(matlab实现)

这篇博客详细介绍了统计分析中的关键概念,包括区间估计、QQ图、秩和检验、方差分析(单因素、双因素、多因素)以及回归分析(多元线性回归和后退法)。通过实例展示了如何运用这些方法来检验数据分布、判断因素影响显著性以及拟合模型。同时,文章提供了MATLAB代码以辅助理解。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

一.区间估计

二、QQ图

三、秩和检验

四、方差分析

4.1单因素方差分析

 4.2双因素方差分析

 4.2多因素方差分析

五、回归分析

5.1多元线性回归

 5.2后退法

一.区间估计

1.有一大批糖果,现从中随机地取16袋,称得重量如下,设袋装糖果的重量近似地服从正态分布,试求总体均值的置信水平为0.95的置信区间

506  508  499  503  504  510  497  512

514  505  493  496  506  502  509  496

clc,clear
x0=[506  508  499  503  504  510  497  512
514  505  493  496  506  502  509  496]; 
x0=x0(:)
alpha=0.05;
m=mean(x0),s=std(x0),n=length(x0);
t=[m-s/sqrt(n)*tinv(1-alpha/2,n-1),m+s/sqrt(n)*tinv(1-alpha/2,n-1)]

2.分别使用金秋和铂球测定引力常数

(1)用金球测定观察值为6.683, 6.681, 6.676, 6.678, 6.679, 6.672。

(2)用铂球测定观察值为6.661, 6.661, 6.667, 6.667, 6.664。

clc, clear
x1=[6.683, 6.681, 6.676, 6.678, 6.679, 6.672];
x2=[6.661, 6.661, 6.667, 6.667, 6.664];
[h1,p1,ci1,st1]=ttest(x1,mean(x1),'Alpha',0.1)%均值检验和区间估计
[h2,p2,ci2,st2]=ttest(x2,mean(x2),'Alpha',0.1)
[h3,p3,ci3,st3]=vartest(x1,var(x1),'Alpha',0.1) %方差检验和区间估计
[h4,p4,ci4,st4]=vartest(x2,var(x1),'Alpha',0.1)

二、QQ图

在统计学中,QQ图是一个用于比较两个概率分布的图形方法。如果这两个分布进行比较相似,QQ图的点会在45度线左右。 

clc,clear
a=readmatrix('F:\数学建模\数学建模算法与应用(第3版)源程序\程序及数据\07第7章  数理统计\data7_5_1.txt');
a=a(~isnan(a));
pd=fitdist(a,'Normal'),qqplot(a,pd) %直接画QQ图,检验正态性
sa=sort(a);%第二种方法
n=length(a);pi=([1:n]-1/2)/n;
yi=norminv(pi,pd.mu,pd.sigma)'; %计算对应的yi值
hold on, plot(yi,sa,'o') 

 

 图表说明:Q-Q 图,全称“Quantile Quantile Plot”用图形的方式比较观测值与预测值(假定正态下的分布)不同分位数的概率分布,从而检验是否吻合正态分布规律。并且将实际数据作为 Y轴,将假定正态时的数据分位数作为 X轴,作散点图,散点与直线重合度越高越服从正态分布,散点差异愈大越不服从正态分布,请视实际情况而定。

三、秩和检验

用于判断两总体是否有显著性差异

试讨论不同烘干温度对抗弯强度在水平a=0.05下是否有显著影响?

120℃

41.5

42.0

40.0

42.5

42.0

42.2

42.7

42.1

41.4

160℃

41.2

41.8

42.4

41.6

41.7

41.3

clc, clear
x=[41.5	42.0	40.0	42.5	42.0	42.2	42.7	42.1	41.4];
y=[41.2	41.8	42.4	41.6	41.7	41.3];
yx=[y,x];
yxr=tiedrank(yx) %计算秩
yr=sum(yxr(1:length(y))) %计算y的秩和,计算的T=39
[p,h,s]=ranksum(y,x) %利用Matlab工具箱直接进行检验

计算得yr=39,查表a=0.05,n1=6,n2=9时,T1和T2分别为33和63 ,所以认为在两种不同的烘干温度下,零件的抗弯强度没有显著差异。(秩和检验表链接秩和检验表 - 豆丁网 (docin.com)

四、方差分析

概念:用数理统计分析试验结果、鉴别各因素对结果影响程度的方法称为方差分析

4.1单因素方差分析

概念:只考虑一个因素A对指标有无显著影响。

A取某个水平下的指标视为随机变量,判断A取不同水平时指标有无显著差别,相当于检验若干总体的均值是否相等。

 试推断这几种工艺制成的灯泡寿命是否有显著差异

A1

A2

A3

A4

1620

1580

1460

1500

1670

1600

1540

1550

1700

1640

1620

1610

1750

1720

1680

1800

 

clc, clear
a=readmatrix('F:\数学建模\数学建模算法与应用(第3版)源程序\程序及数据\07第7章  数理统计\data7_18.txt');
[p,t,st]=anova1(a)
Fa=finv(0.95,t{2,3},t{3,3})

F=3.73>F_{0.05}(3,12)=3.4903,故决绝H_{0},这几种工艺制成的灯泡寿命有显著差异。

P<0.05,所以这几种工艺制成的灯泡寿命有显著差异。

做出统计意义上的决策。 根据计算得到的检验统计量的值 F ,与查表所得的 临界值 Fα(k - 1,n - k) 进行比较,做出统计意义上的决策。若 F > Fα ,则拒绝原假设,即 μ1 = μ2 =... = μi = ... = μk 的假设不成立,表明因素对实验结果的影响比随机误差对实验结果的影响大;F < Fα ,则不能拒绝原假设 H0 ,没有 充分的证据证明因素对实验结果的影响比随机误差对实验结果的影响大。在进行统计决策时,还可以直接利用方差分析表中输出 P 值与显著性水平 α 进行比较,得出结论。

  

 此时,第一个图对应第一种工艺A1离盒子图中心线较远,效果最突出。如果从原始数据中去掉第一种工艺A1的试验数据,得到的结果为各种工艺之间对灯泡寿命效果不显著 .

clc, clear
a=readmatrix('F:\数学建模\数学建模算法与应用(第3版)源程序\程序及数据\07第7章  数理统计\data7_18.txt');
a=a(:,2:4)
[p,t,st]=anova1(a)

 

 4.2双因素方差分析

 两个因素对指标的影响

一种火箭使用了四种燃料、三种推进器,进行射程试验,对于每种燃料与每种推进器的组合作一次试验,问各种燃料之间及各种推进器之间有无显著差异?

推进器1

推进器2

推进器3

燃料1

58.2

56.2

65.3

燃料2

49.1

54.1

51.6

燃料3

60.1

70.9

39.2

燃料4

75.8

58.2

48.7

  

clc,clear
a=readmatrix('F:\数学建模\数学建模算法与应用(第3版)源程序\程序及数据\07第7章  数理统计\data7_20.txt');
[p,t,st]=anova2(a)

 

 

 由P值可知各种燃料和各种推进器之间的差异对于火箭射程无显著影响。

 4.2多因素方差分析

测试多个因素对向量 y 均值的影响。

clc,clear
y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]';
g1 = [1 2 1 2 1 2 1 2]; 
g2 = {'hi';'hi';'lo';'lo';'hi';'hi';'lo';'lo'}; 
g3 = {'may';'may';'may';'may';'june';'june';'june';'june'};
p = anovan(y,{g1,g2,g3})

 

五、回归分析

 回归分析就是对拟合的分析

研究单变量对因变量的影响

研究多个变量对因变量的影响

5.1多元线性回归

rstool(X, Y)  %使用图形界面解法求二项式回归模型

方法一

clc, clear
a=readmatrix('F:\数学建模\数学建模算法与应用(第3版)源程序\程序及数据\07第7章  数理统计\data7_22.txt');
Y = [a(:,2); a([1:end-1],7)]; %提取y的数据
X = [a(:,[3:5]); a([1:end-1],[8:10])];
c=regstats(Y,X) %多元线性回归诊断
beta=c.beta  %提出回归系数
F=c.fstat %f: 37.7453 计算F统计量的多个相关指标
m=3;n=length(Y); %变量个数m,样本点个数n
Fa=finv(0.95,m,n-m-1) %Fa =3.0725 查表计算上alpha分位数
T=c.tstat.t
%   提出4个t统计量的值0.6223
%     0.6090
%     7.7407
%     3.8062
Ta=tinv(0.975,n-m-1) %ta=2.0796 计算上alpha/2分位数
X23 = X(:,[2,3]); %去掉不显著变量x1的数据
nc = regstats(Y, X23)  %重新计算模型
beta2 = nc.beta  %提出新的回归系数

 方法二

clc, clear, close all
a = readmatrix('F:\数学建模\数学建模算法与应用(第3版)源程序\程序及数据\07第7章  数理统计\data7_22.txt')
Y = [a(:,2); a([1:end-1],7)]; %提取y的数据
X = [a(:,[3:5]); a([1:end-1],[8:10])];
md = fitlm(X, Y)
md2 = fitlm(X(:,[2,3]), Y)  %重新建立模型

 

​​rstool(X, Y)  %使用图形界面解法求二项式回归模型

 5.2后退法

 

%后退法
clc,clear
a=readmatrix('F:\数学建模\数学建模算法与应用(第3版)源程序\程序及数据\07第7章  数理统计\data7_25.txt');
x=a(:,1:4);
y=a(:,5);
Ta=tinv(0.975,13-4-1) %ta=2.0796 计算上alpha/2分位数
md0=fitlm(x,y)
md1=fitlm(x,y,'y~1+x1+x2+x4') %剔除x3
md2=fitlm(x,y,'y~1+x1+x2') %在剔除x4
%方法二
md=stepwiselm(x,y,'y~1+x1+x2+x3+x4')

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值