目录
一.区间估计
1.有一大批糖果,现从中随机地取16袋,称得重量如下,设袋装糖果的重量近似地服从正态分布,试求总体均值的置信水平为0.95的置信区间
506 508 499 503 504 510 497 512
514 505 493 496 506 502 509 496
clc,clear
x0=[506 508 499 503 504 510 497 512
514 505 493 496 506 502 509 496];
x0=x0(:)
alpha=0.05;
m=mean(x0),s=std(x0),n=length(x0);
t=[m-s/sqrt(n)*tinv(1-alpha/2,n-1),m+s/sqrt(n)*tinv(1-alpha/2,n-1)]
2.分别使用金秋和铂球测定引力常数
(1)用金球测定观察值为6.683, 6.681, 6.676, 6.678, 6.679, 6.672。
(2)用铂球测定观察值为6.661, 6.661, 6.667, 6.667, 6.664。
clc, clear
x1=[6.683, 6.681, 6.676, 6.678, 6.679, 6.672];
x2=[6.661, 6.661, 6.667, 6.667, 6.664];
[h1,p1,ci1,st1]=ttest(x1,mean(x1),'Alpha',0.1)%均值检验和区间估计
[h2,p2,ci2,st2]=ttest(x2,mean(x2),'Alpha',0.1)
[h3,p3,ci3,st3]=vartest(x1,var(x1),'Alpha',0.1) %方差检验和区间估计
[h4,p4,ci4,st4]=vartest(x2,var(x1),'Alpha',0.1)
二、QQ图
在统计学中,QQ图是一个用于比较两个概率分布的图形方法。如果这两个分布进行比较相似,QQ图的点会在45度线左右。
clc,clear
a=readmatrix('F:\数学建模\数学建模算法与应用(第3版)源程序\程序及数据\07第7章 数理统计\data7_5_1.txt');
a=a(~isnan(a));
pd=fitdist(a,'Normal'),qqplot(a,pd) %直接画QQ图,检验正态性
sa=sort(a);%第二种方法
n=length(a);pi=([1:n]-1/2)/n;
yi=norminv(pi,pd.mu,pd.sigma)'; %计算对应的yi值
hold on, plot(yi,sa,'o')
图表说明:Q-Q 图,全称“Quantile Quantile Plot”用图形的方式比较观测值与预测值(假定正态下的分布)不同分位数的概率分布,从而检验是否吻合正态分布规律。并且将实际数据作为 Y轴,将假定正态时的数据分位数作为 X轴,作散点图,散点与直线重合度越高越服从正态分布,散点差异愈大越不服从正态分布,请视实际情况而定。
三、秩和检验
用于判断两总体是否有显著性差异
试讨论不同烘干温度对抗弯强度在水平a=0.05下是否有显著影响?
120℃ | 41.5 | 42.0 | 40.0 | 42.5 | 42.0 | 42.2 | 42.7 | 42.1 | 41.4 |
160℃ | 41.2 | 41.8 | 42.4 | 41.6 | 41.7 | 41.3 |
clc, clear
x=[41.5 42.0 40.0 42.5 42.0 42.2 42.7 42.1 41.4];
y=[41.2 41.8 42.4 41.6 41.7 41.3];
yx=[y,x];
yxr=tiedrank(yx) %计算秩
yr=sum(yxr(1:length(y))) %计算y的秩和,计算的T=39
[p,h,s]=ranksum(y,x) %利用Matlab工具箱直接进行检验
计算得yr=39,查表a=0.05,n1=6,n2=9时,T1和T2分别为33和63 ,所以认为在两种不同的烘干温度下,零件的抗弯强度没有显著差异。(秩和检验表链接秩和检验表 - 豆丁网 (docin.com))
四、方差分析
概念:用数理统计分析试验结果、鉴别各因素对结果影响程度的方法称为方差分析
4.1单因素方差分析
概念:只考虑一个因素A对指标有无显著影响。
A取某个水平下的指标视为随机变量,判断A取不同水平时指标有无显著差别,相当于检验若干总体的均值是否相等。
试推断这几种工艺制成的灯泡寿命是否有显著差异
A1 | A2 | A3 | A4 |
1620 | 1580 | 1460 | 1500 |
1670 | 1600 | 1540 | 1550 |
1700 | 1640 | 1620 | 1610 |
1750 | 1720 | 1680 | |
1800 |
clc, clear
a=readmatrix('F:\数学建模\数学建模算法与应用(第3版)源程序\程序及数据\07第7章 数理统计\data7_18.txt');
[p,t,st]=anova1(a)
Fa=finv(0.95,t{2,3},t{3,3})
F=3.73>(3,12)=3.4903,故决绝
,这几种工艺制成的灯泡寿命有显著差异。
P<0.05,所以这几种工艺制成的灯泡寿命有显著差异。
做出统计意义上的决策。 根据计算得到的检验统计量的值 F ,与查表所得的 临界值 Fα(k - 1,n - k) 进行比较,做出统计意义上的决策。若 F > Fα ,则拒绝原假设,即 μ1 = μ2 =... = μi = ... = μk 的假设不成立,表明因素对实验结果的影响比随机误差对实验结果的影响大;F < Fα ,则不能拒绝原假设 H0 ,没有 充分的证据证明因素对实验结果的影响比随机误差对实验结果的影响大。在进行统计决策时,还可以直接利用方差分析表中输出 P 值与显著性水平 α 进行比较,得出结论。
此时,第一个图对应第一种工艺A1离盒子图中心线较远,效果最突出。如果从原始数据中去掉第一种工艺A1的试验数据,得到的结果为各种工艺之间对灯泡寿命效果不显著 .
clc, clear
a=readmatrix('F:\数学建模\数学建模算法与应用(第3版)源程序\程序及数据\07第7章 数理统计\data7_18.txt');
a=a(:,2:4)
[p,t,st]=anova1(a)
4.2双因素方差分析
两个因素对指标的影响
一种火箭使用了四种燃料、三种推进器,进行射程试验,对于每种燃料与每种推进器的组合作一次试验,问各种燃料之间及各种推进器之间有无显著差异?
推进器1 | 推进器2 | 推进器3 | |
燃料1 | 58.2 | 56.2 | 65.3 |
燃料2 | 49.1 | 54.1 | 51.6 |
燃料3 | 60.1 | 70.9 | 39.2 |
燃料4 | 75.8 | 58.2 | 48.7 |
clc,clear
a=readmatrix('F:\数学建模\数学建模算法与应用(第3版)源程序\程序及数据\07第7章 数理统计\data7_20.txt');
[p,t,st]=anova2(a)
由P值可知各种燃料和各种推进器之间的差异对于火箭射程无显著影响。
4.2多因素方差分析
测试多个因素对向量 y 均值的影响。
clc,clear
y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]';
g1 = [1 2 1 2 1 2 1 2];
g2 = {'hi';'hi';'lo';'lo';'hi';'hi';'lo';'lo'};
g3 = {'may';'may';'may';'may';'june';'june';'june';'june'};
p = anovan(y,{g1,g2,g3})
五、回归分析
回归分析就是对拟合的分析
研究单变量对因变量的影响
研究多个变量对因变量的影响
5.1多元线性回归
rstool(X, Y) %使用图形界面解法求二项式回归模型
方法一
clc, clear
a=readmatrix('F:\数学建模\数学建模算法与应用(第3版)源程序\程序及数据\07第7章 数理统计\data7_22.txt');
Y = [a(:,2); a([1:end-1],7)]; %提取y的数据
X = [a(:,[3:5]); a([1:end-1],[8:10])];
c=regstats(Y,X) %多元线性回归诊断
beta=c.beta %提出回归系数
F=c.fstat %f: 37.7453 计算F统计量的多个相关指标
m=3;n=length(Y); %变量个数m,样本点个数n
Fa=finv(0.95,m,n-m-1) %Fa =3.0725 查表计算上alpha分位数
T=c.tstat.t
% 提出4个t统计量的值0.6223
% 0.6090
% 7.7407
% 3.8062
Ta=tinv(0.975,n-m-1) %ta=2.0796 计算上alpha/2分位数
X23 = X(:,[2,3]); %去掉不显著变量x1的数据
nc = regstats(Y, X23) %重新计算模型
beta2 = nc.beta %提出新的回归系数
方法二
clc, clear, close all
a = readmatrix('F:\数学建模\数学建模算法与应用(第3版)源程序\程序及数据\07第7章 数理统计\data7_22.txt')
Y = [a(:,2); a([1:end-1],7)]; %提取y的数据
X = [a(:,[3:5]); a([1:end-1],[8:10])];
md = fitlm(X, Y)
md2 = fitlm(X(:,[2,3]), Y) %重新建立模型
rstool(X, Y) %使用图形界面解法求二项式回归模型
5.2后退法
%后退法
clc,clear
a=readmatrix('F:\数学建模\数学建模算法与应用(第3版)源程序\程序及数据\07第7章 数理统计\data7_25.txt');
x=a(:,1:4);
y=a(:,5);
Ta=tinv(0.975,13-4-1) %ta=2.0796 计算上alpha/2分位数
md0=fitlm(x,y)
md1=fitlm(x,y,'y~1+x1+x2+x4') %剔除x3
md2=fitlm(x,y,'y~1+x1+x2') %在剔除x4
%方法二
md=stepwiselm(x,y,'y~1+x1+x2+x3+x4')