一: 基本点估值
①均值
X¯¯¯表示样本的均值
μ^ 表示总体的均值的点估计量
当认为可以使用样本均值代替总体均值的点估计量时
μ^ = X¯¯¯
②方差
σ^² 表示总体方差的点估计量
σ^² = (Σ(x-x¯)²) / (n-1)
σ^²通常也叫作s²
③成功率/成功比例
糖果公司发现,在一次样本调查中,有40个人,其中32个人选择更喜欢他们的口香糖,而剩下的8个人则更喜欢竞争对手的口香糖
那么根据这个样本符合什么分布呢,有n,p。
如果说X表示总体的喜欢口香糖的人的数量的话,那么X ~ B(n,p)
P^ = Ps 使用样本的成功比例估计总体的成功比例
Ps = 成功数目/样本数据,这个既可以称之为成功的比例,也可以称之为成功的概率
二 已知总体的均值,求样本成功率为特定值时的概率
案例:糖果公司按盒售卖糖果,每盒糖果中有100颗糖果,已知总体里有25%都是红色糖果,求每盒糖果中有40%红色糖果的概率
①查看与样本相当的其他样本,在这里样本就是每盒糖果,样本的大小为n,n=100
②查看样本成功比率的分布P^,,其中X为每盒汤锅中红色糖果的数量,计算其均值和方差
step1
E(P^) = E(X/n) = E(X)/n
Var(P^) = Var(X/n) = Var(X)/n²
step2
把每盒糖果当做一道题,把红色糖果的数目当做可能的答案,那么这个分布是一个二项分布,X ~ B(n,p)
所以E(X) = np E(P^) = p
Var(X) = npq Var(P^) = pq/n
当n特别大的时候(n>30)P^ = Ps 服从正太分布
Ps = N(p,pq/n)
step3
做连续性修正:+−− 1/2n
③得出上述分布后,代入特定值求出特定值的概率
根据 40%这个特定值求出标准分,在概率表找出对应的概率
三
根据总体的统计,把总体拆分成小包装后,每个小包装的均值为10,方差为1,一位顾客买了30袋,结果发现每袋糖球中的糖球平均数目只有8.5
①查看与样本相当的其他样本,在这里样本就是这30袋糖球
②查看样本的均值的分布X¯¯¯,,其中X为每袋糖球中糖球的数目,计算其均值和方差
E(X¯¯¯) = (E(X1) + E(X2) + … E(Xn)) / n = nE(X)/n = E(X) = μ
Var(X¯¯¯) = (Var(X1) + Var(X2) + … Var(Xn)) / n = nVar(X)/n² = Var(X)/n = σ²/n
X ~ N(μ, σ²)则 X¯¯¯ ~ N(μ, σ²/n)
根据中心极限定理,如果X不一定是正态分布,从非正态总体中取出的样本很大,则X¯¯¯服从正态分布,样本数量>30,如果总体的均值和方差为μ和σ²,那么
X¯¯¯ ~ N(μ, σ²/n)
二项分布和泊松分布都是依据这个原理转化为正态分布的